|
|
Vincent Claveau, Marie-Claude L'Homme,
Apprentissage par analogie pour la structuration de
terminologie - Utilisation comparée de ressources endogenes et
exogenes,
Actes de la 6ème rencontre
de Terminologie et Intelligence Artificielle (TIA'05), Rouen, France,
avril 2005,
Document
(pdf) |
|
Résumé
Cet article présente une méthode originale pour
détecter en corpus spécialisé des couples de
termes morphologiquement liés et prédire le lien
sémantique qui les unit dans le domaine étudié.
Ces liens sémantiques, modélisés à l’aide
de fonctions lexicales, permettent ainsi de structurer une terminologie
du domaine. La méthode exposée repose sur une technique
d’apprentissage artificiel par analogie qui permet de confronter
efficacement des couples de mots inconnus à des exemples de
couples de termes dont le lien sémantique est connu. Elle tire
également parti d’un système d’extraction de termes qui
permet d’éviter la détection de liens non pertinents dans
le domaine.
Cette approche est évaluée dans le domaine de
l’informatique ; les résultats montrent que l’approche simple
que nous proposons est très performante. Deux expériences
sont notamment menées, l’une utilisant des exemples issus du
domaine, l’autre, des exemples tirés d’une base
généraliste. La comparaison des résultats de
chacune d’elles permet ainsi d’évaluer quantitativement
l’intérêt de telles ressources généralistes
pour ce type de tâches et apporte ainsi une contribution
chiffrée au débat opposant l’utilisation ressources
endogènes et exogènes en terminologie computationnelle. |
|
|