Google vuelve a tomar la delantera en la comunicación global con el lanzamiento de Gemini 3.5 Live Translate, un avanzado modelo de audio diseñado para la traducción de voz a voz en tiempo real con inteligencia artificial.
La nueva tecnología de Google permite conversaciones fluidas y naturales sin interrupciones, integrándose en Google Translate, Meet y disponible para desarrolladores a través de su API.
Google vuelve a tomar la delantera en la comunicación global con el lanzamiento de Gemini 3.5 Live Translate, un avanzado modelo de audio diseñado para la traducción de voz a voz en tiempo real con inteligencia artificial.
Esta herramienta, basada en el modelo Gemini 3 Pro, promete transformar la manera en que personas de diferentes idiomas interactúan al eliminar las pausas incómodas de los sistemas tradicionales y también con la promesa de mantener la voz del usuario en vez de usar una tonalidad genérica. Es en este último punto donde Google saca ventaja ya que eleva el nivel de personalización.
A diferencia de los sistemas de traducción convencionales que funcionan por "turnos", esperando a que el orador termine de hablar para procesar la frase, Gemini 3.5 Live Translate utiliza un procesamiento de flujo continuo. Esto significa que el modelo comienza a traducir mientras la persona aún está hablando, manteniendo un retraso de apenas unos segundos para ofrecer una experiencia casi simultánea.
Entre sus características técnicas más destacadas se encuentran:
La disponibilidad de Gemini 3.5 Live Translate varía según la plataforma y el tipo de usuario, pero el despliegue general comenzó el 9 de junio de 2026.
Es importante notar que, aunque el despliegue global de la traducción en vivo ya ha comenzado, algunas funciones específicas potenciadas por Gemini (como las de tono y contexto añadidas previamente) podrían seguir limitadas geográficamente a ciertas regiones como EE. UU. e India.
Para combatir la desinformación y el uso malintencionado, Google ha integrado la tecnología SynthID, que añade una marca de agua imperceptible en todo el audio generado por la IA para permitir identificar que se trata de una traducción sintética.
Aunque el modelo muestra una calidad impresionante, Google reconoce ciertas limitaciones actuales, como posibles inconsistencias en la voz tras pausas largas o dificultades menores en la detección de acentos muy fuertes o idiomas muy similares entre sí. Sin embargo, la llegada de Gemini 3.5 Live Translate acerca a la realidad el concepto de "traductor universal" que antes solo existía en la ciencia ficción.