Membres ESO du projet
Disciplines
En 2022, l’algorithme Whisper (https://github.com/openai/whisper) de retranscription automatique à partir d’audio a été créé. Version après version, les taux d’erreur et le temps de retranscription continuent de diminuer. Toutefois, le développement de cet outil n’est pas sans soulever des questionnements sur l’étape de la retranscription, qui correspond à un temps long de la recherche rarement interrogé en Sciences Humaines et Sociales. Le projet “Chuchotons” part de l’idée que l’ouverture au plus grand nombre des outils de retranscription automatique représente une opportunité d’interroger les enjeux de la retranscription dans notre pratique de la recherche. Les réflexions de l’équipe suivront plusieurs axes, sans qu’ils soient totalement exhaustifs.
Développer un guide critique à l’attention des utilisateur·rices de l’algorithme Whisper.
Les méthodes d’entretien sont très souvent mobilisées dans les processus de recherche des sociologues et géographes. Ces méthodes sont coûteuses en temps, et l’étape de la retranscription est souvent pensée comme fastidieuse, chronophage et dépourvue d’intérêt scientifique, quand elle n’est pas entièrement externalisée. Le déploiement des modèles de retranscription automatique offre une grande opportunité pour le développement d’une approche critique du processus de retranscription. Cette dernière s’articule autour de deux volets principaux : i) les limites techniques et les biais produits par le modèle Whisper ; ii) les transformations du processus de recherche en sociologie et géographie au prisme de la retranscription automatisée. Pour ce faire, l’équipe entend s’appuyer sur la bibliographie disponible et sur une expérimentation collective du modèle Whisper, expérimentation dont l’objectif est de déceler les avantages et les inconvénients de cette technique de retranscription dans différents contextes de recherche, et avec différents types d’audios.
Interroger la façon dont nos pratiques de la retranscription recomposent nos façons de faire de la recherche.
Dans un processus classique de recherche, la chaîne de traitement des données compte un temps jugé important de retranscription mécanique, à l’écoute d’un audio. Si cette pratique varie d’une personne à l’autre – logiciels utilisés, exactitude de la retranscription, lissage du langage oral – les choix méthodologiques qu’elle suscite sont la plupart du temps implicites et rarement questionnés. Pourtant, pour S. Beaud (1996) , ce premier temps d’écoute et d’écriture est déjà un moment d’interprétation, voire d’analyse des données, qu’il faut être capable de questionner.
Le projet “Chuchotons” s’intéresse à la façon dont la retranscription automatisée reconfigure cette chaîne de traitement des données audios. Comment interagit-elle avec la façon d’exploiter ces données ? Permet-elle de dégager un temps supplémentaire pour leur analyse, ou au contraire, conduit-elle à leur accumulation et à leur quantification ? Facilite-t-elle une restitution honorable de la parole des enquêtés·es, pour reprendre les mots de S. Beaud et F. Weber, ou bien contribue-t-elle à un appauvrissement de leur interprétation ?