Google déploie le modèle Gemini 3.5 Live Translate sur plusieurs de ses produits. Une technologie de traduction audio promise avec une grande fluidité.
Dans la famille des modèles Gemini 3.5, Google dévoile Gemini 3.5 Live Translate pour des interactions multilingues naturelles. Une traduction audio qui s'approche du temps réel avec la prise en charge de plusieurs dizaines de langues.Pour rendre la traduction fluide
Gemini 3.5 Live Translate peut traiter et générer la parole en continu, contrairement à des systèmes au tout par tour qui attendent la fin d'une phrase pour traduire. Le décalage n'est que de quelques secondes avec l'orateur.
Le modèle vise également une qualité supérieure. Au-delà de la traduction, il s'efforce de préserver l'intonation et le rythme de la voix originale. Il est en outre conçu pour être robuste au bruit pour fonctionner dans divers environnements.
Un déploiement sur plusieurs fronts
Afin d'intégrer la traduction vocale dans leurs applications, les développeurs peuvent accéder Gemini 3.5 Live Translate en preview publique via l'API Gemini Live et Google AI Studio.
Des partenaires comme Grab testent le modèle pour faciliter la communication entre chauffeurs et voyageurs, qui échangent plus de 10 millions d'appels vocaux par mois.
Pour les entreprises, l'intégration dans Google Meet est imminente avec une preview privée à destination de certains clients Google Workspace dès ce mois-ci. L'outil y supportera plus de 70 langues, créant plus de 2 000 combinaisons linguistiques possibles dans une même réunion.
Il s'agit d'une avancée par rapport aux cinq langues précédemment prises en charge qui devaient obligatoirement transiter par l'anglais.
Et pour Google Traduction
Le modèle est également déployé pour l'application Google Traduction sur Android et iOS. Sur Android, un nouveau mode d'écoute avec Gemini 3.5 Live Translate fera son apparition. Il suffira de porter le téléphone à l'oreille, comme pour un appel, pour entendre la traduction de manière discrète, sans écouteurs.
L'audio généré par Gemini 3.5 Live Translate intègre le filigrane (watermark) SynthID pour la détection d'un contenu par IA et aider à prévenir la désinformation.
merci à GNT
