ROMANSEVAL 
Appel à participation - Call for participation
 
 
APPEL A PARTICIPATION
CALL FOR PARTICIPATION
BANDO DI PARTECIPAZIONE
EVALUATION DE SYSTEMES DE DESAMBIGUISATION LEXICALE
WORD SENSE DISAMBIGUATION EVALUATION EXERCISE
VALUTAZIONE DI SISTEMI PER LA DISAMBIGUAZIONE LESSICALE
     
Sous-groupe de SENSEVAL pour le français et l'italien
Sub-group of SENSEVAL for Italian and French
Sottogruppo di SENSEVAL per l'italiano e il francese
     
L'action SENSEVAL, récemment lancée sous le parrainage de l'ACL-SIGLEX and EURALEX a pour but l'évaluation de systèmes de désambiguïsation lexicale. Dans ce cadre il est prévu d'organiser une compétition amicale entre systèmes. Celle-ci donnera lieu à un colloque de présentation et de discussion des résultats à: The goal of SENSEVAL (sponsored by ACL-SIGLEX and EURALEX) is to evaluate Word Sense Disambiguation Systems. Different systems will participate and present their results during the SENSEVAL workshop to happen at: Lo scopo del iniziativa SENSEVAL, lanciata da ACL-SIGLEX e da EURALEX consiste nel valutare sistemi per la disambiguazione semantico lessicale. Sistemi differenti saranno coinvolti in una competizione amichevole e i risultati saranno presentati durante il workshop di SENSEVAL, che avrà luogo a:
     
Herstmonceux Castle, Sussex (United Kindom), September 2-4, 1998.
(http://www.itri.bton.ac.uk/events/senseval/)
     
Les discussions à l'intérieur du comité de programme de SENSEVAL ont mis en relief les différences qui existent au niveau des ressources linguistiques (corpus, dictionnaires, etc.) entre l'anglais et les autres langues, et rendent souhaitable l'organisation d'une compétition spécifique ces dernières. Discussions among the SENSEVAL program committee members pointed out the differences in existing linguistic resources (corpora, dictionaries, etc.) between English and other languages and decided to organise a more specific competition for languages which lack resources. La discussione tra i vari membri del comitato organizzatore di SENSEVAL ha messo in rilievo la differenza in termini di risorse linguistiche (dizionari, corpora...) esistente tra l'inglese ed altre lingue. Si è perciò deciso di organizzare una specifica competizione riservata a queste ultime.
     
Le présent appel vous invite à participer à une action spécifique à l'intérieur de SENSEVAL, orientée vers deux langues romanes, le français et l'italien. We invite you to participate, within SENSEVAL, to a specific exercise for Italian and French. Con il presente bando si invita a partecipare ad una speciale azione che, nell'ambito di SENSEVAL, coinvolga l'italiano e il francese.
     
CORPUS CORPUS CORPUS
     
Le corpus de test sera constitué des textes multilingues parallèles collectés dans le cadre du projet MLCC-MULTEXT, composé de questions écrites des parlementaires européens a la Commission, et des réponses correspondantes. Le corpus comporte environ un million de mots par langue, et comporte plusieurs milliers de textes sur les sujets les plus divers (politique, recherche, santé, environnement, économie, etc.). Il pourra être complété par d'autres textes spécifiques à chacune des langues testées. Ce corpus sera diffusé par l'ELRA aux participants au prix de 45 ECU. The parallel text corpora MLCC-MULTEXT will serve as a test corpus. The whole corpus is about one million words per language and consists of several thousands of texts dealing with different topics (politics, research, health, economy, environment, etc.). Each participating team will be free to complement this corpus with other specific texts available to them for both languages. The MLCC-MULTEXT corpus will be made available to the SENSEVAL participants at the cost of 45 ECU, through ELRA. I corpora paralleli multilingui raccolti nell'ambito del progetto MLCC-MULTEXT (formati essenzialmente da interrogazioni di parlamentari dell'UE e relative risposte) saranno utilizzati come test corpus. L'intero corpus consiste di circa un milione di parole per lingua e comprende migliaia di testi riguardanti argomenti disparati (politica, ricerca scientifica, salute, economia, ecologia...). Ogni team sarà libero di arricchire questo corpus con i testi a lui disponibili per la lingua di interesse. Il corpus MLCC-MULTEXT sarà disponibile per i partecipanti al prezzo di 45 ECU attraverso ELRA.
     
DICTIONNAIRE DICTIONARY DIZIONARIO
     
La liste des sens qui serviront à l'étiquetage sera fournie par un dictionnaire commercial sur CD-ROM de prix modique (en cours de sélection). The list of senses that will be used to hand-tag the corpora will be provided by off-the-shelf affordable dictionaries available in CD-ROM format. La lista dei sensi utilizzata per il tagging manuale dei corpora sarà desunta da dizionari, si e possibile, su CD-ROM disponibili in commercio ad un prezzo ragionevole.
     
MODALITES DE PARTICIPATION PARTICIPATION MODALITIES MODALITA' DI PARTECIPAZIONE
     
Les participants ne peuvent se retirer en cours de compétition et s'engagent à accepter la publication des résultats. Participants cannot withdraw during the competition and accept the publication of the results. Si intende che i partecipanti non possano ritirarsi nel corso della competizione e si impegnino ad accettare la pubblicazione dei risultati.
     
CALENDRIER TIMETABLE SCADENZE
     
Mi-mars : 
  • expression d'intérêt
Fin mars : 
  • distribution du corpus brut 
Fin avril : 
  • test à blanc 
Fin mai : 
  • distribution de la liste des mots à étiqueter 
Fin juin : 
  • retour des mots étiquetés 
Fin juillet : 
  • diffusion des résultats 
2-4 septembre : 
  • colloque
Mid March : 
  • expression of interest 
End of March : 
  • distribution of raw corpus 
End of April : 
  • dry run 
End of May : 
  • distribution of list of words to tag 
End of June : 
  • return of the words tagged 
End of July : 
  • results made available 
2-4 September: 
  • workshop
Metà marzo : 
  • dichiarazione di interesse 
Fine marzo : 
  • distribuzione del corpus 
Fine aprile: 
  • dry run 
Fine maggio : 
  • distribuzione della lista di parole da marcare 
Fine giugno : 
  • raccolta delle parole marcate 
Fine luglio : 
  • diffusione dei risultati 
2-4 settembre : 
  • workshop
     
AUTRES INFORMATIONS MISCELLANEOUS VARIE
     
Les autres informations concernant ROMANSEVAL seront placées sur le Web: All information related to ROMANSEVAL will be accessible from the web at: Tutte le informazione relative a ROMANSEVAL saranno disponibili presso il sito Web:
     
http://aune.lpl.univ-aix.fr/projects/romanseval/
     
IMPORTANT: ENVOYEZ UN MESSAGE EXPRIMANT VOTRE INTENTION DE PARTICIPER AVANT LE 15 MARS 1998 A PLEASE, SEND US A MESSAGE WITH YOUR """INTENTION TO" "PARTICIPATE"" NOT LATER" THAN MARCH, 15 TO PER FAVORE, IN CASO DI INTERESSE, INVIATECI UN MESSAGGIO DI """INTENZIONE DI" "PARTECIPARE"" NON DOPO" IL 15 MARZO 1998 A
     
Frederique.Second@xrce.xerox.com
Jean.Veronis@lpl.univ-aix.fr
     
Cet appel peut être étendu à d'autres langues. Si vous êtes volontaire pour coordonner un autre language, veuillez nous contacter. If you are interested in co-ordinating a parallel activity for another language, please contact please contact us. Il presente bando può essere esteso ad altre lingue romanze. Chiunque sia interessato a coordinare il lavoro su altre lingue, e' pregato di contattarci quanto prima.
     
COMITE DE PROGRAMME PROGRAM COMMITTEE COMITATO DI PROGRAMMA
     
Roberto Basili 
Henri Bejoint 
Nicoletta Calzolari 
Luca Dini 
Khalid Choukri 
Marc El-Beze 
Frederique Segond 
Jean Véronis 
Antonio Zampolli
Università di Roma, Tor Vergata 
Université de Lyon II 
Istituto di Linguistica Computazionale, Pisa 
CELI, Torino 
ELRA/ELDA 
LIA, Université d'Avignon 
Xerox Research Centre Europe, Grenoble 
Université de Provence 
Istituto di LinguisticaComputazionale, Pisa