Calame : Un logiciel de transcription en code source libre
Thomas Soulas, Yves Ferstler, Valentyna Tsilinchuk, Yassine Chahdi, Catherine Lavoie, Gaëlle Laperrière, Marie-Jean Meurs
Résumé : Bien que la recherche en traitement automatique de la parole soit très active, ses résultats demeurent peu accessibles aux personnes non-expertes. Les systèmes qui en sont issus ont pourtant de nombreuses applications, telles la transcription de réunions, d’entretiens et de conférences. Les non-spécialistes ont ainsi souvent recours à des solutions commerciales coûteuses, manquant généralement de modularité et fonctionnalités, sans protection des données sensibles et exposées aux cybermenaces. Afin de rendre le traitement automatiquement la parole accessible à la fois à la communauté scientifique et au grand public, nous avons lancé Calame : un logiciel gratuit en code source libre, utilisable en local et à distance. Calame permet actuellement de traiter l’anglais et le français de France, le français québécois ainsi que d’autres langues à faibles ressources étant progressivement intégrés grâce à l’affinage de modèles à l’état de l’art.
Mots clés : ['Traitement automatique du langage naturel', 'traitement automatique de la parole', 'transcription automatique', 'code source libre', 'langues peu dotées', 'verbatim']