|
|
Vincent Claveau,
Acquisition automatique de lexiques sémantiques
pour la recherche d'information,
Thèse de doctorat, Université de Rennes 1,
décembre 2003,
Document (pdf), Document (ps.gz) |
|
Résumé De
nombreuses applications du traitement automatique des langues
(recherche
d'information, traduction automatique, etc.) requièrent des
ressources
sémantiques spécifiques à leur tâche et
à leur domaine.
Pour répondre à ces besoins spécifiques, nous
avons développé ASARES, un système
d'acquisition d'informations sémantiques lexicales sur corpus.
Celui-ci répond à un triple objectif : il permet de
fournir
des résultats de bonne qualité, ses résultats et
le processus ayant conduit à
leur extraction sont interprétables, et enfin, il est assez
générique et automatique pour être aisément
portable d'un corpus à un
autre.
Pour ce faire, ASARES s'appuie sur une technique d'apprentissage
artificiel
symbolique --- la programmation logique inductive --- qui lui permet
d'inférer
des patrons d'extraction morphosyntaxiques et sémantiques
à partir d'exemples
des éléments lexicaux sémantiques que l'on
souhaite acquérir. Ces patrons sont
ensuite utilisés pour extraire du corpus de nouveaux
éléments.
Nous montrons également qu'il est possible de combiner cette
approche
symbolique avec des techniques d'acquisition statistiques qui
confèrent une
plus grande automaticité à ASARES.
Pour évaluer la validité de notre méthode, nous
l'avons appliquée à l'extraction
d'un type de relations sémantiques entre noms et verbes
définies au sein du
Lexique génératif appelées relations qualia.
Cette tâche d'acquisition revêt deux intérêts
principaux. D'une part, ces
relations ne sont définies que de manière
théorique ; l'interprétabilité
linguistique des patrons inférés permet donc d'en
préciser le
fonctionnement et les réalisations en contexte.
D'autre part, plusieurs auteurs ont noté l'intérêt
de ce type de relations dans le domaine de la recherche d'information
pour donner accès à des
reformulations sémantiquement équivalentes d'une
même idée. Grâce à une expérience
d'extension de requêtes, nous vérifions
expérimentalement
cette affirmation : nous montrons que les résultats d'un
système de
recherche exploitant ces relations qualia, acquises par ASARES, sont
améliorés
de manière significative quoique localisée. |
|
|