V. Claveau > Publications > Résumé JADT 2000 OLSTOLST
English version

Pascale Sébillot, Pierrette Bouillon, Vincent Claveau, Cécile Fabre, Laurence Jacqmin, Jacques Nicolas
Apprentissage en corpus de couples nom-verbe pour la construction d'un lexique génératif,
JADT 2000 (journées d'analyse de données textuelles), Lausanne, Suisse, mars 2000,
Document (pdf)

Résumé Désambiguïser, paraphraser sont des activités qui nécessitent pour les systèmes de TAL de s'appuyer sur des descriptions lexicales fines. Dans ce but, cet article propose une méthode pour extraire automatiquement à partir de corpus des informations lexicales définies par Pustejovsky dans le cadre du Lexique Génératif. Dans une des composantes de ce modèle lexical, la structure des qualia, les noms sont décrits à l aide de rôles sémantiques, principalement en termes d associations verbales. Par exemple, le mot mesurer exprime le rôle télique du nom jaugeur. Notre méthode consiste à extraire automatiquement, pour un nom (N) donné, les verbes (V) qui permettent de remplir cette structure des qualia. Elle est basée sur une technique d'apprentissage dans le cadre de la Programmation Logique Inductive, et nous permet de distinguer les paires N-V liées par une relation sémantique de celles qui ne le sont pas. Les résultats obtenus, comparés à un test du Chi2 sont encourageants à deux titres : cette technique repère une proportion importante de paires pertinentes et fournit des informations qui peuvent être utilisées pour construire des règles linguistiques.


validation W3C