talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Une étude comparative de méthodes de catégorisation sémantique de termes techniques

Farid Cerbah

Résumé : L'acquisition et la mise à jour de ressources terminologiques sont des tâches difficiles, en particulier lorsque ces ressources contiennent des informations d'ordre sémantique. Cette article traite de la catégorisation sémantique de termes techniques. Le but de ce processus est d'assigner des domaines sémantiques à de nouveaux termes. Nous proposons deux approches qui reposent sur des sources d'informations différentes. L'approche exogène exploite des informations contextuelles extraites de corpus. L'approche endogène repose sur une analyse lexicale de termes déjà catégorisés. Nous décrivons les deux approches mises en oeuvre ainsi que les expérimentations menées sur des jeux de test significatifs. Les résultats obtenus montrent que la catégorisation de termes peut constituer une aide conséquente dans les processus d'acquisition de ressources terminologiques.

Mots clés : acquisition de termes techniques, terminologie, analyse lexicale, corpus