talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Identification de Contextes Riches en Connaissances en corpus comparable

Firas Hmida

Résumé : Dans les études s’intéressant à la traduction assistée par ordinateur (TAO), l’un des objectifs consiste à repérer les passages qui focalisent l’attention des traducteurs humains. Ces passages sont considérés comme étant des contextes « riches en connaissances », car ils aident à la traduction. Certains contextes textuels ne donnent qu’une simple attestation d’un terme recherché, même s’ils le renferment. Ils ne fournissent pas d’informations qui permettent de saisir sa signification. D’autres, en revanche, contiennent des fragments de définitions, mentionnent une variante terminologique ou utilisent d’autres notions facilitant la compréhension du terme. Ce travail s’intéresse aux « contextes définitoires » qui sont utiles à l’acquisition de connaissances à partir de textes, en particulier dans la perspective de traduction terminologique assistée par ordinateur à partir de corpus comparables. En effet, l’association d’un exemple à un terme permet d’en appréhender le sens exact. Nous proposons, tout d’abord, trois hypothèses définissant la notion d’exemple définitoire. Ensuite nous évaluons sa validité grâce une méthode s’appuyant sur les Contextes Riches en Connaissances (CRC) ainsi que les relations hiérarchiques reliant les termes entre eux.

Abstract : Some contexts provide only a simple explanation of a given term even if they contain it. However, others contain fragments of definitions, mention a terminological variant or use other concepts to make it easy the term understanding. In this work we focus on « definitory contexts » that would be valuable to a human for knowledge acquisition from texts, mainly in order to assist in terminological translation from comparable corpora. Indeed, provide the term with an example, makes it possible to understand its exact meaning. First, we specify three hypothesis defining the concept of a defnitory example. Then we evaluate its validity through a method based on the knowledge-Rich Contexts (KRCs) and hierarchical relationships between terms.

Mots clés : Contextes Riches en Connaissances, CRC, identification de définitions, identification d’exemples, énoncé définitoire, terminologie, traduction terminologique

Keywords : Knowledge-Rich Contexts, KRCs, mining definitions, minging examples, terminology, terminological translation