|
Pierrette Bouillon and Vincent Claveau and
Cécile
Fabre and Pascale Sébillot
Using Part-of-Speech and Semantic Tagging for the
Corpus-Based Learning of Qualia Structure Elements,
First international workshop on Generative Approaches to the Lexicon
(GL'2001), Genève, Suisse, avril 2001,
Document
(ps) |
|
Résumé Cet
article décrit l'implémentation et les résultats
d'une méthode d'apprentissage automatique,
développée dans le cadre de la programmation logique
inductive (PLI - ILP), pour extraire automatiquement d'un corpus
étiqueté catégoriellement et
sémantiquement, des paires Nom-Verbe dont les composants sont
liés par une des relations définies dans la structure des
qualia dans le Lexique Génératif [Pustejovsky 95]. Nous
montrons que l'étiquetage sémantique améliore la
qualité de l'apprentissage, à la fois d'un point de vue
théorique et empirique. Nous mettons aussi en évidence la
pertinence de la signification linguistique de certaines des
règles apprises en ce qui concerne la détection
d'éléments distinguant, en termes de contexte
catégoriel et sémantique, les paires Nom-Verbe
liées par une des relations qualia des paires qui ne sont pas
reliées sémantiquement. |
|
|