cnrs

GRACE

Évaluation de systèmes d'assignation de catégories grammaticales



Qu'est-ce que GRACE ?

L'action GRACE est une composante du programme thématique "Cognition, Communication intelligente et Ingénierie des langues" du CNRS, dont les responsables sont J. Mariani (Limsi) et R. Martin (INaLF). Elle vise à la mise en place du paradigme d'évaluation pour les analyseurs morpho-syntaxiques et syntaxiques du langage naturel et la constitution d'un premier noyau de données réutilisables pour l'évaluation de systèmes linguistiques d'analyse du français.

La documentation technique du projet est accessible sur le site temporaire ftp GRACE

<URL:ftp//ftp.linguist.jussieu.fr/Linguist/GRACE>

(Attention ! Cette adresse changera dans un avenir proche).



Qu'est-ce que la session d'évaluation GRACE I

La session d'évaluation GRACE I a pour objectif d'évaluer comparativement les performances des systèmes d'assignation de catégories grammaticales pour le français. L'évaluation sera une évaluation multi-critères (tous systèmes confondus et par classes de systèmes) permettant ainsi de tenir compte des spécificités des systèmes liées aux conditions qui ont suscite leur création.



Qui peut participer ?

Toute équipe disposant d'un assignateur de catégories grammaticales opérationnel pour le français. Que ce soit un système générique développe dans le but d'émuler un opérateur humain dans la tache d'assignation de catégories grammaticales sur du texte libre, ou bien un système spécifique à un traitement linguistique particulier, destine à être intégré dans une chaîne de processus plus complexe et dont l'objectif se situe au-delà de l'assignation de catégories grammaticales (e.g. correcteur orthographique). L'activité sectorielle de l'équipe (institution publique, entreprise industrielle) ainsi que sa nationalité (les équipes étrangères travaillant sur le français sont les bienvenues) ne sont pas discriminantes. Rappelons que toutes les équipes qui disposent d'un système operationnel ont intérêt à participer à la session d'évaluation GRACE I, car cela fournira, pour la première fois, des points de comparaison objectifs sur des données communes dans un environnement neutre, donnant ainsi aux développeurs de tels systèmes, chercheurs et ingénieurs, une meilleure vision des avantages et défauts liés aux différentes méthodes et différentes approches.



Comment se déroulera la session d'évaluation GRACE I ?

La session d'évaluation se déroulera en 3 phases : Voici l'ébauche d'un calendrier prévisionnel qui pourra être revu en fonction de l'avancement du projet et des disponibilités des participants: En ce qui concerne les mesures de performance, il y aura une mesure globale pour tous les systèmes confondus et une mesure par classe de systèmes, les participants choisissant la ou les classes dans lesquelles ils désirent participer parmi une liste préétablie. L'évaluation se fera essentiellement sur les capacités de désambiguisation. Nous avons décidé d'imposer aux participants les informations lexicales d'où tous les jeux d'étiquettes seront dérivés, ainsi ils devront fournir les fonctions de correspondance entre les jeux d'étiquettes qu'ils utilisent et ceux des lexiques de GRACE. L'évaluation se fait alors en comparant l'entrée du catégoriseur et sa sortie. Cette évaluation ne prend pas en compte les capacités de segmentation des catégoriseurs.

Engagements des participants

Outre les engagements concernant les données reçues, les participants qui auront commence la session d'évaluation GRACE I, s'engageront à prendre part a l'intégralité de la session d'évaluation. Pour l'évaluation, chaque participant devra fournir une table de correspondance entre son jeu d'étiquettes et les étiquettes MULTEXT (des exemples de tables de correspondance seront fournis).


Pour en savoir plus: Patrick Paroubek <pap@ciril.fr>