Avec un nouveau modèle capable de traduire en temps réel plus de 70 langues tout en préservant la voix et les intonations des interlocuteurs, Google franchit une nouvelle étape dans la communication multilingue assistée par l’intelligence artificielle.
Par Yakout Abina
Google lance Gemini 3.5 Live Translate, un outil de traduction instantanée capable de gérer plus de 70 langues. Intégré à Google Meet et à l’application Traduction, il restitue la voix et l’intonation du locuteur, offrant des échanges multilingues fluides et naturels.
Après avoir traité plus d’un trillion de mots traduits chaque mois à travers ses services, Google mise désormais sur une communication multilingue fluide et continue, sans interruption artificielle entre les échanges.
Le géant américain vient de dévoiler Gemini 3.5 Live Translate, un nouveau modèle audio capable de traduire des conversations en direct dans plus de 70 langues sans pour autant attendre la fin de la phrase pour fournir la traduction.
L’outil s’intègre directement à Google Meet et à l’application Traduction, mais pourrait également trouver sa place dans d’autres services de l’écosystème. Avec cette innovation, Google entend faciliter les échanges multilingues, qu’il s’agisse de réunions professionnelles ou de discussions quotidiennes.
Ce qui change avec Gemini 3.5 Live Translate, c’est sa voix artificielle, qui sonne de manière très humaine tout en conservant l’intonation, le rythme et le ton de la personne qui parle. Un léger décalage de quelques secondes subsiste, comparable à celui d’un interprète professionnel. Ce délai permet au système d’analyser le contexte avant de livrer une traduction fluide et cohérente. Une avancée qui rapproche encore davantage la technologie de l’expérience d’un échange naturel.
L’outil repère automatiquement plus de 70 langues, supprimant la nécessité de changer manuellement la langue selon l’interlocuteur. Il a, par ailleurs, été conçu pour rester performant même dans des environnements bruyants. Enfin, pour prévenir les dérives et garantir la transparence, Google y intègre également SynthID, un « tatouage numérique » inséré directement dans le signal audio. Ce marquage invisible permet d’identifier si un contenu a été généré par une IA, renforçant ainsi la transparence et la confiance dans les échanges multilingues.
Ces avancées profitent naturellement en premier lieu à l’écosystème Google. C’est notamment le cas de Google Meet, qui s’affranchit de ses anciennes limites et qui peut désormais gérer des réunions impliquant plus de 2 000 combinaisons linguistiques, contre seulement cinq auparavant. Autre évolution majeure, il n’est plus nécessaire de passer par l’anglais comme langue de base pour traduire les échanges.
Le nouveau modèle de traduction instantanée de Google commence à trouver des applications concrètes auprès des entreprises partenaires. C’est le cas de la plateforme asiatique Grab, qui l’expérimente pour améliorer la communication entre chauffeurs et passagers, ouvrant la voie à une utilisation dans les services de mobilité. Les développeurs peuvent également accéder à ces fonctions via l’API Gemini Live pour créer leurs propres applications de traduction.
Pour le grand public, l’application Google Traduction sur Android et iOS profite aussi de ces nouveautés. Si vous mettez des écouteurs, vous entendrez la traduction directement dans vos oreilles, avec le ton exact de la personne qui parle. Si vous avez un téléphone Android, il existe même un « mode écoute » très pratique qui demande simplement de placer le téléphone contre votre oreille, comme lors d’un appel, afin d’écouter la traduction discrètement sans gêner les autres.
L’évolution fulgurante des intelligences artificielles comme Gemini 3.5 Live Translate pose cependant une question légitime : quel est l’avenir des traducteurs, des interprètes et des écoles qui les forment ?
Pour éviter de former des diplômés obsolètes, les instituts et universités ont déjà commencé à transformer radicalement leurs programmes afin de s’adapter aux mutations. L’époque où l’on apprenait uniquement à transposer un texte d’une langue A vers une langue B est révolue. Les étudiants apprennent désormais à utiliser des logiciels de TAO (traduction assistée par ordinateur), à corriger et améliorer les traductions automatiques (post-édition) et à intégrer l’IA dans leur pratique. Cela leur permet de gagner en rapidité et en précision.
Mais si l’IA peut traduire une conversation courante ou un manuel, elle se heurte encore à un mur invisible dès qu’il s’agit de haute diplomatie, de droit ou d’administration. Au sein des institutions internationales comme l’ONU, les interprètes ont toujours un rôle indispensable et continuent d’être recrutés pour plusieurs raisons cruciales, parmi lesquelles la gestion des nuances et de l’implicite. Car, en diplomatie, un mot mal choisi peut déclencher un incident international. L’interprète humain capte le sous-texte, l’ironie, l’humour ou le poids géopolitique d’une formule de politesse, des éléments qui échappent encore à la logique mathématique des algorithmes. Il en va de même pour la responsabilité juridique et éthique. Une IA ne peut pas être tenue juridiquement responsable d’une erreur de traduction dans un traité international. L’humain apporte une garantie de responsabilité et de confidentialité essentielle.
Ces dernières années, la technologie s’est imposée dans le quotidien des experts en langues. Les termes « logiciel de traduction assistée par ordinateur », « bases de données terminologiques » ou encore « mémoires de traduction » sont désormais familiers aux professionnels du secteur. Cependant, ces outils ont pour fonction d’assister le traducteur dans sa tâche, et non de le remplacer. Leur rôle est d’optimiser le travail, d’accélérer le processus et d’assurer une meilleure cohérence, tout en laissant à l’humain la responsabilité de l’interprétation et de la nuance.
Y.A
////////
