Google a officialisé le déploiement de Gemini 3.5 Live Translate, un modèle d'intelligence artificielle conçu pour la traduction vocale en temps réel. La solution, accessible dès à présent en "public preview", vise à éliminer les latences qui caractérisent les systèmes de traduction automatique traditionnels.
Une fluidité inédite dans les échanges
Contrairement aux outils classiques qui fonctionnent en mode "tour par tour", imposant des pauses entre la fin d'un énoncé et sa traduction, Gemini 3.5 Live Translate génère la parole en continu. Selon le géant américain, le système préserve l'intonation, le rythme et la hauteur de voix de l'interlocuteur d'origine. Il est également conçu pour résister aux bruits ambiants et détecte automatiquement la langue parlée, sans nécessiter de configuration manuelle préalable.
La traduction de conversations orales en entreprise a longtemps souffert de ces temps de latence, qui rompent la dynamique d'une négociation ou d'une session de support technique. Google affirme que sa nouvelle IA permet de contourner cet écueil, rendant les échanges plus naturels.
Un déploiement via l'API pour les développeurs
La technologie est proposée aux développeurs via l'API Gemini Live et Google AI Studio. Les entreprises peuvent également l'intégrer à leurs applications en s'appuyant sur des plateformes d'intégration tierces, telles que Agora, LiveKit ou Pipecat. Cette approche permet de déployer des fonctions de traduction vocale instantanée sans avoir à développer une infrastructure spécifique.
Google Meet : des réunions multilingues en temps réel
Parallèlement à l'offre API, Google a intégré cette fonctionnalité dans Google Workspace, et plus particulièrement dans Google Meet. Les réunions professionnelles peuvent ainsi devenir multilingues de manière native, chaque participant s'exprimant dans sa langue tout en entendant la traduction dans la sienne, sans délai perceptible.
Avec cette avancée, Google cible aussi bien les développeurs que les directions métiers et les utilisateurs en mobilité, confirmant sa volonté de positionner l'IA vocale comme un outil clé de la collaboration professionnelle.
Cette annonce marque une nouvelle étape dans le développement des modèles Gemini, qui cherchent à rivaliser avec d'autres solutions de traduction simultanée et à s'imposer comme un standard pour les communications d'affaires multilingues.