10 de junio de 2026 - 21:37

Google lanza Gemini 3.5 Live Translate: traducción de voz fluida, en tiempo real y en más de 70 idiomas

La nueva tecnología de Google permite conversaciones fluidas y naturales sin interrupciones, integrándose en Google Translate, Meet y disponible para desarrolladores a través de su API.

Google vuelve a tomar la delantera en la comunicación global con el lanzamiento de Gemini 3.5 Live Translate, un avanzado modelo de audio diseñado para la traducción de voz a voz en tiempo real con inteligencia artificial.

Esta herramienta, basada en el modelo Gemini 3 Pro, promete transformar la manera en que personas de diferentes idiomas interactúan al eliminar las pausas incómodas de los sistemas tradicionales y también con la promesa de mantener la voz del usuario en vez de usar una tonalidad genérica. Es en este último punto donde Google saca ventaja ya que eleva el nivel de personalización.

Cómo funciona Gemini 3.5 Live Translate

A diferencia de los sistemas de traducción convencionales que funcionan por "turnos", esperando a que el orador termine de hablar para procesar la frase, Gemini 3.5 Live Translate utiliza un procesamiento de flujo continuo. Esto significa que el modelo comienza a traducir mientras la persona aún está hablando, manteniendo un retraso de apenas unos segundos para ofrecer una experiencia casi simultánea.

Embed - Introducing Gemini 3.5 Live Translate

Entre sus características técnicas más destacadas se encuentran:

  • Preservación de la esencia vocal: el sistema no genera una voz robótica genérica; en su lugar, intenta mantener la entonación, el ritmo y el tono del orador original.
  • Traducción nativa de audio: a diferencia de sistemas antiguos que transcribían audio a texto y luego de vuelta a audio, este modelo procesa el habla de forma nativa, lo que reduce drásticamente la latencia.
  • Robustez ante el ruido: está diseñado para funcionar en entornos ruidosos y detectar automáticamente entre más de 70 idiomas sin necesidad de configuraciones manuales.

¿Quiénes pueden usarlo y desde cuándo?

La disponibilidad de Gemini 3.5 Live Translate varía según la plataforma y el tipo de usuario, pero el despliegue general comenzó el 9 de junio de 2026.

  • Usuarios generales (Google Translate): Ya está disponible a nivel global en las aplicaciones de Android e iOS. Los usuarios solo necesitan conectar auriculares para disfrutar de una traducción fluida. Además, en Android se ha introducido un "modo escucha" que permite pegar el teléfono al oído como en una llamada privada para oír la traducción. El acceso a través de la aplicación de Google Translate para Android e iOS es gratuito.
  • Empresas (Google Meet): La función ha entrado en una fase de "vista previa privada" para clientes seleccionados de Google Workspace Business. En Meet, la capacidad ha saltado de soportar solo 5 idiomas a más de 70, permitiendo más de 2,000 combinaciones lingüísticas directas en una sola reunión. Para quienes integran esta tecnología en sus propias aplicaciones, el servicio tiene un costo de $0.023 por minuto de audio
  • Desarrolladores: A través de la Gemini Live API y Google AI Studio, los desarrolladores ya pueden integrar esta tecnología en sus propias aplicaciones. Empresas como Grab ya están probando la API para facilitar la comunicación entre conductores y pasajeros. Para este grupo aun no hay definición de precios.
Embed - Speech translation in Google Meet with Gemini 3.5 Live Translate

Es importante notar que, aunque el despliegue global de la traducción en vivo ya ha comenzado, algunas funciones específicas potenciadas por Gemini (como las de tono y contexto añadidas previamente) podrían seguir limitadas geográficamente a ciertas regiones como EE. UU. e India.

Seguridad y ética en la traducción

Para combatir la desinformación y el uso malintencionado, Google ha integrado la tecnología SynthID, que añade una marca de agua imperceptible en todo el audio generado por la IA para permitir identificar que se trata de una traducción sintética.

Aunque el modelo muestra una calidad impresionante, Google reconoce ciertas limitaciones actuales, como posibles inconsistencias en la voz tras pausas largas o dificultades menores en la detección de acentos muy fuertes o idiomas muy similares entre sí. Sin embargo, la llegada de Gemini 3.5 Live Translate acerca a la realidad el concepto de "traductor universal" que antes solo existía en la ciencia ficción.

LAS MAS LEIDAS