talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

CQuAE : Un nouveau corpus de question-réponse pour l'enseignement

Thomas Gerald, Louis Tamames, Sofiane Ettayeb, Patrick Paroubek, Anne Vilnat

Résumé : Dans cet article nous présentons un nouveau corpus de question-réponse en français pour le domaine de l'éducation. Ce corpus à été construit dans le but de créer un système d'assistant virtuel pour répondre à des questions sur des documents ou du matériel de cours. Afin d'être utile autant aux enseignants qu'au étudiants, il est important de considérer des questions complexes ainsi que d'être capable de justifier les réponses sur du matériel validé. Nous présentons donc le nouveau Corpus CQuAE, un corpus de question-réponse manuellement annoté dont nous discutons des propriétés. Nous présenterons aussi les différentes étapes de sa création avec aujourd'hui une phase d'amélioration des données.Enfin, nous présentons plusieurs expériences pour évaluer l'exploitation du corpus dans le cadre d'un système de question-réponse automatique.Ces différentes analyses et expériences nous permettrons de valider l'adéquation des données collectés pour l'objectif visé.

Mots clés : question-réponse,corpus,éducation