La start-up HeyGen a récemment développé un outil révolutionnaire permettant de traduire une langue étrangère en temps réel dans une vidéo. Cette technologie unique consiste à traduire le texte prononcé par la personne filmée en respectant sa voix et ses intonations, tout en ajustant le mouvement des lèvres pour correspondre au texte dans la langue traduite. Cette innovation suscite des questions sur l’avenir des doublages et des sous-titres dans l’industrie du cinéma et de la télévision. Pour éclairer cette problématique, nous nous sommes entretenus avec Claire Larsonneur, linguiste et maîtresse de conférences à l’Université de Paris-8.
La querelle entre pro-VOST et pro-VF
Depuis l’avènement du cinéma, une querelle oppose les puristes qui préfèrent les versions originales sous-titrées (VOST) et ceux qui privilégient les versions doublées (VF). Les partisans des VOST critiquent souvent la mauvaise synchronisation labiale des doublages, tandis que les adeptes de la VF préfèrent se détendre et ne pas se soucier des défauts de traduction. Cette division a parfois causé des tensions au sein des familles et a brisé des amitiés. L’IA de HeyGen pourrait-elle mettre fin à ces conflits en permettant une traduction et une adaptation du mouvement des lèvres ?
Le fonctionnement de la technologie de HeyGen
Selon Claire Larsonneur, l’outil de HeyGen combine différentes technologies déjà existantes. Tout d’abord, il utilise un moteur de traduction entraîné sur un corpus de textes. Ensuite, il effectue une transcription voix-texte puis texte-voix pour oraliser la traduction. Enfin, il utilise une banque de données associant le son au mouvement des lèvres dans différentes langues, garantissant ainsi une correspondance entre le texte prononcé et le mouvement des lèvres dans la langue cible. Cependant, la linguiste souligne les inconvénients de cette technologie, notamment son empreinte environnementale importante en termes de consommation d’énergie, de bande passante et de stockage.
Divers domaines d’application
Selon Claire Larsonneur, l’intelligence artificielle générative connaît une forte croissance, et l’outil de HeyGen pourrait trouver des applications dans divers secteurs. Aurélien Capdecomme, directeur des Nouvelles Technologies au sein de 20 Minutes, évoque notamment le marketing et la publicité pour le luxe. La linguiste, quant à elle, suggère une utilisation plus immédiate dans la communication d’entreprise. Par exemple, un PDG pourrait s’enregistrer dans sa langue maternelle pour une assemblée générale d’actionnaires ou le lancement d’un nouveau modèle, ce qui lui permettrait de s’exprimer avec davantage d’aisance et d’émotion.
Prévenir les fake news
La technologie de HeyGen soulève également des inquiétudes quant à la manipulation de vidéos et à la propagation de fake news. Claire Larsonneur souligne la nécessité de mettre en place des mesures de sécurité pour éviter tout abus. Elle propose notamment d’ajouter un tampon ou un watermark indélébile sur les vidéos produites avec cet outil, afin d’indiquer clairement qu’elles ont été générées par une IA. Cette précaution empêcherait leur utilisation à des fins trompeuses.
La fin de la querelle entre pro-VOST et pro-VF ?
Selon la linguiste, la véritable question est de savoir qui préfère regarder des vidéos en version originale sous-titrée. Ceux qui apprécient les VOST pour des raisons linguistiques continueront probablement à privilégier cette option, qu’il s’agisse d’une traduction classique ou de l’utilisation de l’IA de HeyGen. De plus, certains films ne sont disponibles qu’en français sur certaines plates-formes, en raison de contraintes de stockage et de bande passante. Enfin, dans l’industrie du doublage, le travail des doubleurs reste essentiel pour transmettre les émotions des personnages. Bien que l’IA de HeyGen parvienne à reproduire une voix naturelle en utilisant les voix des doubleurs, sa base ne prend en charge que 20 langues, alors qu’il existe environ 7 000 langues dans le monde. Ainsi, il est peu probable que les traductions robotiques remplacent les doublages professionnels de sitôt.
Google DeepMind >>
L’image est uniquement à des fins illustratives et ne représente pas la situation réelle.
Vous pourriez vouloir lire !
- L’avènement de l’intelligence artificielle propulse Nvidia vers de nouvelles conquêtes
- Bard : L’essor de l’IA conversationnelle de Google dans le domaine de ChatGPT
- Le rôle de l’intelligence artificielle dans l’avenir des séries télévisées
- Un jackpot record remporté au Loto : les résultats du mercredi 19 juillet 2023
- Mission Impossible 7 avec Tom Cruise : Le défi improbable de la réalisation
Titulo en français : Mission Impossible 7 avec Tom Cruise : Le défi improbable de la réalisation
- Maroc-Burkina Faso : Quand le football se met au service des victimes de…
- Exploration éditoriale des Littératures européennes à Cognac
Titre : Amélie Nothomb, lauréate du prestigieux prix des Littératures européennes à Cognac
- Les lectures incontournables sur Allende et le Chili | Le Grand Continent
- “Ne laisser personne de côté” : Ursula von der Leyen maintient son engagement pour l’inclusion sociale et économique
- Appel pour une transition industrielle verte en Europe : vers une économie durable et responsable
- Découverte macabre sous la dalle : les nouvelles fouilles dans l’affaire de la disparition d’Émile