talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Automatiser la rédaction de définitions terminographiques : questions et traitements

Selja Seppälä

Résumé : Dans cet article, nous présentons une analyse manuelle de corpus de contextes conceptuels afin (i) de voir dans quelle mesure les méthodes de TALN existantes sont en principe adéquates pour automatiser la rédaction de définitions terminographiques, et (ii) de dégager des question précises dont la résolution permettrait d’automatiser davantage la production de définitions. Le but est de contribuer à la réflexion sur les enjeux de l’automatisation de cette tâche, en procédant à une série d’analyses qui nous mènent, étape par étape, à examiner l’adéquation des méthodes d’extraction de définitions et de contextes plus larges au travail terminographique de rédaction des définitions. De ces analyses émergent des questions précises relatives à la pertinence des informations extraites et à leur sélection. Des propositions de solutions et leurs implications pour le TALN sont examinées.

Abstract : A manual corpus analysis of conceptual contexts is presented in order (i) to indicatively evaluate to what extent NLP methods can in principle be used to automate the production of terminographic definitions, and (ii) to identify central questions to be answered if one wants to further automate the task. The objective is to contribute to reflection on the challenges faced by the automation of this task. Through a series of analyses, the adequacy of extraction methods for defining or knowledge-rich contexts is examined in the light of the terminographic activity of definition writing. Precise questions emerge from these analyses relating to the relevance and the selection of the extracted information. Some solutions are proposed and their implications to NLP reviewed.

Mots clés : Terminologie, définitions terminographiques, sélection des traits, pertinence des traits, extraction de définitions, contextes conceptuels, traitement automatique des définitions.

Keywords : Terminology, terminographic definitions, feature selection, feature relevance, definition extraction, conceptual contexts, definition processing.