talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse syntaxique automatique de langues du combinatoire au calculatoire

Jacques Vergne

Résumé : Nous proposons de montrer comment l'analyse syntaxique automatique est aujourd'hui à un tournant de son évolution, en mettant l'accent sur l'évolution des modèles d'analyse syntaxique : de l'analyse de langages de programmation (compilation) à l'analyse de langues, et, dans le cadre de l'analyse de langues, de l'analyse combinatoire à l'analyse calculatoire, en passant par le tagging et le chunking (synthèse en section 4). On marquera d'abord le poids historique des grammaires formelles, comme outil de modélisation des langues et des langages formels (section 1), et comment la compilation a été transposée en traduction automatique par Bernard Vauquois. On analysera ensuite pourquoi il n'a pas été possible d'obtenir en analyse de langue un fonctionnement analogue à la compilation, et pourquoi la complexité linéaire de la compilation n'a pas pu être transposée en analyse syntaxique (section 2). Les codes analysés étant fondamentalement différents, et le tagging ayant montré la voie, nous en avons pris acte en abandonnant la compilation transposée : plus de dictionnaire exhaustif en entrée, plus de grammaire formelle pour modéliser les structures linguistiques (section 3). Nous montrerons comment, dans nos analyseurs, nous avons implémenté une solution calculatoire, de complexité linéaire (section 5). Nous conclurons (section 6) en pointant quelques évolutions des tâches de l'analyse syntaxique.

Abstract : In this paper, we intend to show how automatic parsing is today at a change of direction. We will stress the evolution of parsing models : from programming language parsing (compilation) to natural language parsing, and, within the frame of natural language parsing, from combinatory parsing to calculatory parsing, while going through tagging and chunking (synthesis in section 4). First we stress the historical weight of formal grammars, as a modelling tool for natural languages and formal languages (section 1), and how compilation has been transposed into machine translation by Bernard Vauquois. Then we analyse why it was not possible to get a natural language parsing which works the same way as compilation, and why the linear complexity of compilation could not be transposed into NL parsing (section 2). Since parsed languages are radically different, and since tagging showed the right way, we decided to abandon the transposed compilation : no more exhaustive dictionary as input, no more formal grammar to model linguistic structures (section 3). We will show how, in our parsers, we implemented a calculatory solution, of linear complexity (section 5). We conclude (section 6), stressing some trends of parsing about its tasks.