|
|
Pascale Sébillot, Pierrette Bouillon,
Vincent
Claveau, Cécile Fabre, Laurence Jacqmin, Jacques Nicolas
Apprentissage en corpus de couples nom-verbe pour la
construction
d'un lexique génératif,
JADT 2000 (journées d'analyse de données
textuelles), Lausanne, Suisse, mars 2000,
Document (pdf) |
|
Résumé
Désambiguïser, paraphraser sont des activités qui
nécessitent pour les systèmes de TAL de s'appuyer sur des
descriptions lexicales fines. Dans ce but, cet article propose une
méthode pour extraire automatiquement à partir de corpus
des informations lexicales définies par Pustejovsky dans le
cadre
du Lexique Génératif. Dans une des composantes de ce
modèle lexical, la structure des qualia, les noms sont
décrits à l aide de rôles sémantiques,
principalement en termes d associations verbales. Par exemple, le mot
mesurer exprime le rôle télique du nom jaugeur. Notre
méthode consiste à extraire automatiquement, pour un nom
(N) donné, les verbes (V) qui permettent de remplir cette
structure des qualia. Elle est basée sur une technique
d'apprentissage dans le cadre de la Programmation Logique Inductive, et
nous permet de distinguer les paires N-V liées par une relation
sémantique de celles qui ne le sont pas. Les résultats
obtenus, comparés à un test du Chi2 sont encourageants
à deux titres : cette technique repère une proportion
importante de paires pertinentes et fournit des informations qui
peuvent
être utilisées pour construire des règles
linguistiques. |
|
|