Traitement automatique de la langue arabe écrite et parlée
Arabic Language Processing - Text & Speech


 

JEP-TALN-RECITAL 2004

 

Programme des sessions (PDF)

Appel à communication « Traitement automatique de la langue arabe écrite et parlée »

Call for papers "Arabic Language Processing, Text and Speech"

Comité scientifique / Scientific committee


Compte tenu du nombre élevé des soumissions sur le thème du "Traitement automatique de la langue arabe écrite et parlée", plusieurs sessions différentes seront organisées :

  • session orale plénière commune à JEP et à TALN (2h00 + conférence invitée)
  • session orale parallèle commune à JEP et à TALN (2h00)
  • session poster 1 (2h00)
  • session poster 2 (2h00)

Le programme de chacune des sessions sera bientôt disponible.


Due to the high number of submissions on the topic of "Arabic Language Processing, Text and Speech",several different sessions will be organized:

  • Plenary Speech Session, JEP & TALN (2h00 + invited speaker)
  • Parallel Speech Session, JEP & TALN (2h00)
  • Poster session 1 (2h00)
  • Poster session 2 (2h00)

Session programmes will soon be announced.


Appel à communication « Traitement automatique de la langue arabe écrite et parlée »

Par ses propriétés morphologiques, syntaxiques, phonétiques et phonologiques, la langue arabe est considérée comme faisant partie des langues difficiles à appréhender dans le domaine du traitement automatique du langage écrit et parlé.

Dans le domaine du traitement automatique de l'arabe écrit, les recherches ont débuté vers les années 1970, avant même que les problèmes d'édition de textes arabes ne soient complètement maîtrisés. Les premiers travaux concernaient notamment les lexiques et la morphologie. Depuis une dizaine d'années, l'internationalisation du Web et la prolifération des moyens de communication en langue arabe, ont révélé un grand nombre d'applications du TALN arabe. Les travaux de recherche ont ainsi commencé à aborder des problématiques plus variées comme la syntaxe, la traduction automatique, l'indexation automatique des documents, la recherche d'information, etc.

Dans le domaine du traitement automatique de l'arabe parlé, des progrès considérables ont été réalisés grâce à l'amélioration des technologies du traitement du signal, à l'enrichissement des connaissances sur les caractéristiques prosodiques et segmentales et sur les différentes modélisations acoustiques relatives aux schèmes arabes. Ces résultats devraient permettre de mieux appréhender des domaines variés et innovants tels que la reconnaissance et la synthèse de la parole, la traduction orale ou la reconnaissance automatique du locuteur et de ses origines géographiques, etc.

L'objectif de cette session est de réunir des chercheurs sur le traitement automatique de la langue arabe, aussi bien dans la communauté de l'écrit que dans celle de l'oral. Cette rencontre sera l'occasion de faire le point sur les avancées dans ces domaines, au niveau scientifique et applicatif et dans des contextes monolingues ou multilingues. Le renforcement des liens de collaboration entre les communautés de l'écrit et de l'oral de l'arabe est également un des objectifs de cette session.

Thèmes

Les thèmes qui seront abordés dans cette session consacrée au traitement automatique de l'arabe écrit et parlé incluent, de façon non limitative :

  • Reconnaissance et compréhension de la parole
  • Synthèse de la parole
  • Génération automatique de la prosodie
  • Reconnaissance de la langue, du locuteur et de ses origines géographiques
  • Corpus arabes et ressources langagières
  • Acquisition de la parole dans les systèmes de synthèse et de RAP
  • Morphologie
  • Syntaxe
  • Sémantique
  • Analyse et génération
  • Analyse du discours
  • Résumé automatique
  • Dialogue
  • Traduction automatique

Critères de sélection

Les auteurs sont invités à soumettre des travaux de recherche originaux, n'ayant pas fait l'objet de publications antérieures. Les soumissions seront examinées par au moins deux spécialistes du domaine. Seront considérées en particulier :

  • l'importance et l'originalité de la contribution
  • la correction du contenu scientifique et technique
  • la discussion critique des résultats, en particulier par rapport aux autres travaux du domaine
  • la situation des travaux dans le contexte de la recherche internationale
  • l'organisation et la clarté de la présentation
  • l'adéquation aux thèmes de la conférence

Les articles devront être rédigés en français ou en anglais.

Modalités de soumission

Les soumissions par courrier électronique devront être envoyées à l'adresse suivante :

jep-taln04-arabic@fsdmfes.ac.ma

L'objet du message devra obligatoirement comporter la mention : JEP-TALN-2004-Arabic

En cas d'impossibilité d'envoi par courrier électronique, une soumission par voie postale sera acceptée. Une disquette et 3 exemplaires papier de la contribution devront être envoyés à l'une des deux adresses suivantes :

Malek Boualem
France Telecom R&D - DMI/GRI
2, avenue Pierre Marzin
22307 Lannion - France

ou

Noureddine Chenfour
Département de Math. et Informatique
Faculté des Sciences Dhar El Mahraz, Fès
BP : 1796 Atlas, Fès - Maroc

Format pour les soumissions

Les auteurs devront envoyer leur soumission sous la forme d'un document attaché à un courrier électronique ayant pour titre " JEP-TALN-2004-Arabic" et contenant le titre de la communication, le nom, l'affiliation, l'adresse postale, l'adresse électronique, le numéro de téléphone et le fax de l'auteur principal.

Le format PDF devra IMPÉRATIVEMENT être employé. Dans certains cas particuliers, nous accepterons des contribution en format RTF (Word).

Les articles soumis ne devront pas dépasser 6 à 10 pages en Times 12, espacement simple, soit environ 3000 mots, figures, exemples et références compris.

Les versions devront être au format A4.

Instructions pour la création de fichiers PDF

Date limite de soumission :

15 janvier 2004

Notification aux auteurs :

20 février 2004

Version finale (prêt-à-clicher) :

8 mars 2004

Conférence :

19-22 avril 2004


Call for papers "Arabic Language Processing, Text and Speech"

Due to its morphological, syntactic, phonetic and phonologic properties, the Arabic language is considered to be one of the most difficult languages for written and spoken language processing.

Research on written Arabic language processing started in the 1970s, even before the problems of Arabic text editing were completely solved. The first studies focused primarily on lexicons and morphology. In the past ten years, the internationalisation of the WWW and the proliferation of communication tools in Arabic have led to the need for a large number of Arabic NLP applications. As a result, research activity has extended to address more general areas of Arabic language processing, including syntactic analysis, machine translation, document indexing, information retrieval, etc.

Research on Arabic speech processing has made significant progress due to more improved signal processing technologies, and to recent advances in the knowledge of the prosodic and the segmental characteristics of Arabic and the acoustic modelling of Arab schemes. These results should make it possible to further progress in more innovative areas, such as Arabic speech recognition and synthesis, speech translation and automatic identification of a speaker and his/her geographic origin discrimination, etc.

The aim of the joint session is to gather and reinforce collaboration between researchers from both the written and spoken Arabic language processing communities. It will also offer the opportunity to discuss recent advances on both the scientific and application sides of the problem, in monolingual and multilingual contexts.

Topics

This special session on written and spoken Arabic processing includes (but is not limited to) the following topics :

  • Speech recognition and comprehension
  • Text to speech synthesis
  • Automatic prosody generation
  • Automatic speaker and language identification
  • Geographic origin discrimination of Arabic speakers
  • Arabic corpora & resources
  • Speech acquisition for ASR and TTS systems
  • Morphology
  • Syntax
  • Semantics
  • Text parsing and generation
  • Discourse analysis
  • Text summarization
  • Dialogue
  • Machine translation

Selection

Authors are invited to submit original, previously unpublished research work. Submissions will be reviewed by at least two specialists of the domain.

Decisions will be based on the following criteria :

  • importance and originality of the paper
  • soundness of the scientific and technical content
  • comparison of the results obtained with other relevant works
  • clarity of the exposition
  • relevance to the topics of the conference

All papers should be in English or French.

Submission procedure

Electronic submissions with the message object "JEP-TALN-2004-Arabic" should be sent to the following email address :

jep-taln04-arabic@fsdmfes.ac.ma

In case electronic submission is not possible, printed versions might be accepted. In this case, three hard-copies of the paper together with a floppy disk, should be sent to either address :

Malek Boualem
France Telecom R&D - DMI/GRI
2, avenue Pierre Marzin
22307 Lannion - France

or

Noureddine Chenfour
Département de Math. et Informatique
Faculté des Sciences Dhar El Mahraz, Fès
BP : 1796 Atlas, Fez - Morocco

Paper format

Submitted papers should be about 6 to 10 pages in Times 12pt, single spaced, including figures, examples and references.

Papers MUST be sent in PDF format. In particular cases, we might accept submissions in RTF (Word) format.

All the PostScript versions must be in A4 format, and not US Letter.

Submission deadline:

15 January 2004

Notification to authors:

20 February 2004

Camera-ready:

8 March 2004

Conference:

19-22 April 2004