talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

VoiceStick : un corpus de parole spontanée pour le guidage vocal de drones

Allan Henry, Solange Rossato, Christian Graff, Sylvain Huet, Jose-Ernesto Gomez-Balderas

Résumé : Cet article introduit VoiceStick, le premier corpus francophone de parole spontanée dédié au guidage vocal de drones, comblant ainsi un manque notable dans les ressources pour l’interaction humain-robot en langue française. Constitué auprès de 29 binômes dans un paradigme asymétrique guide-pilote en réalité mixte, le corpus capture la dynamique naturelle d’une interaction spontanée. Totalisant 4 219 énoncés pour 19 829 mots, VoiceStick se distingue par une richesse lexicale témoignant de la liberté d’expression accordée aux locuteurs. Le corpus intègre un étiquetage dual corrélant transcriptions textuelles et commandes motrices réelles, permettant de distinguer l’intention sémantique de l’action pragmatique effective. Une expérimentation de référence via une architecture en cascade atteint 94 % d’exactitude sur les commandes explicites, tandis que la performance de 70 % sur la parole spontanée illustre la complexité des ambiguïtés inhérentes à ce type d’interaction.

Mots clés : Parole spontanée, Interaction Humain-Robot (IHR), Corpus, Commande vocale, Pilotage de drone