Membres ESO du projet
Disciplines
Autres projets de recherche récents (participation)
En 2022, l’algorithme Whisper (https://github.com/openai/whisper) de retranscription automatique à partir d’audio a été créé. Version après version, les taux d’erreur et le temps de retranscription continuent de diminuer. Toutefois, le développement de cet outil n’est pas sans soulever des questionnements sur l’étape de la retranscription, qui correspond à un temps long de la recherche rarement interrogé en Sciences Humaines et Sociales. Le projet “Chuchotons” part de l’idée que l’ouverture au plus grand nombre des outils de retranscription automatique représente une opportunité d’interroger les enjeux de la retranscription dans notre pratique de la recherche. Les réflexions de l’équipe suivront plusieurs axes, sans qu’ils soient totalement exhaustifs.
Mettre à disposition un outil de retranscription automatique performant et sécurisé, adapté à la recherche à ESO.
La première étape du projet vise à la création d’une interface ergonomique à l’échelle de l’UMR ESO permettant d’utiliser les fonctionnalités de l’algorithme Whisper en toute sécurité et simplement. Pour cela, une collaboration avec la Direction de la Sécurité Informatique de l’Université Rennes 2 a pris forme. L’interface A.L.I.C.E. développée par Marital Limousin, sera déployée dans un premier temps à l’échelle de l’Université, puis sur un domaine réservé aux membres de l’UMR. Cette interface devrait changer le quotidien de l’ensemble de la communauté ESO.
Développer un guide critique à l’attention des utilisateurs·rices d’A.L.I.C.E. et de l’algorithme Whisper.
Les méthodes d’entretien sont très souvent mobilisées dans les processus de recherche des sociologues et géographes. Ces méthodes sont coûteuses en temps, et l’étape de la retranscription est souvent pensée comme fastidieuse, chronophage et dépourvue d’intérêt scientifique, quand elle n’est pas entièrement externalisée. Le déploiement de l’interface A.L.I.C.E. offre une grande opportunité pour le développement d’une approche critique du processus de retranscription. Cette dernière s’articule autour de deux volets principaux : i) Les limites techniques et les biais produits par l’algorithme Whisper ; ii) Les transformations du processus de recherche en sociologie et géographie au prisme de la retranscription automatisée. C’est surtout le premier volet qui sera décrit dans le guide critique à l’attention des utilisateurs·rices de l’interface A.L.I.C.E. Pour ce faire, l’équipe entend s’appuyer sur la bibliographie disponible et sur une expérimentation collective de l’algorithme Whisper, dont l’objectif est de déceler les avantages et les inconvénients de cette technique de retranscription dans différents contextes de recherche, et avec différents types d’audios.
Interroger nos pratiques de la retranscription pour recomposer nos façons de faire de la recherche
Dans un processus classique de recherche, la chaîne de traitement des données compte un temps jugé important de retranscription mécanique, à l’écoute d’un audio. Si cette pratique varie d’une personne à l’autre – logiciels utilisés, exactitude de la retranscription, lissage du langage oral – les choix méthodologiques qu’elle suscite sont la plupart du temps implicites et rarement questionnés. Pourtant, pour S. Beaud, ce premier temps d’écoute et d’écriture est déjà un moment d’interprétation, voire d’analyse des données, qu’il faut être capable de questionner.
Le projet “Chuchotons” s’intéresse à la façon dont la retranscription automatisée bouleverse cette chaîne de traitement des données audios. Comment interagit-elle avec la façon d’exploiter ces données ? Permet-elle de dégager un temps supplémentaire pour leur analyse, ou au contraire, conduit-elle à leur accumulation ? Facilite-t-elle une restitution honorable de la parole des enquêtés·es, pour reprendre les mots de S. Beaux et F. Weber, ou bien contribue-t-elle à un appauvrissement de leur interprétation ?