Tal y como estaba previsto, Google ha celebrado hoy la conferencia inaugural de Google I/O 2025, su evento anual para desarrolladores donde suelen presentar novedades en torno a sus productos y servicios.
Este año no ha sido una excepción, y los de Mountain View han mostrado Gemini 2.5, Beam, Project Astra, Project Mariner, Veo 3, Imagen 4 y novedades en Canvas, entre otras cosas.
Aquí hacemos un rápido repaso a los aspectos más destacados de cada una de estas novedades:
Gemini 2.5 y la era del Deep Think
La estrella indiscutible de Google I/O 2025 es Gemini 2.5, el modelo de IA más avanzado de Google hasta la fecha, que domina rankings como LMArena y se integra profundamente en productos clave como la Búsqueda, la app de Gemini o Google Workspace.
Llega además con dos variantes muy potentes:
Gemini 2.5 Flash, más rápido y barato, ideal para desarrolladores.
Gemini 2.5 Pro, que incorpora Deep Think, un nuevo modo de razonamiento que se apoya en técnicas de pensamiento paralelo para ofrecer respuestas más precisas y complejas.
Beam: videollamadas 3D y traducción con IA en Meet
Google también presentó Beam, una evolución del Project Starline que convierte videollamadas tradicionales en experiencias 3D realistas con ayuda de seis cámaras y modelos de IA avanzados. Llegará a finales de año en colaboración con HP.
Además, Meet se actualiza con traducción de voz en tiempo real. Imitando el tono y timbre original del hablante, esta función —ya disponible en beta para inglés y español— promete romper barreras lingüísticas en entornos profesionales.
Project Astra, Mariner y el auge de los agentes
El asistente con cámara de Project Astra ya forma parte de Gemini Live, que ahora permite usar cámara y pantalla compartida desde Android e iOS. A esto se suma Project Mariner, un prototipo que permite a los agentes controlar un ordenador, automatizar tareas y aprender por demostración. Ya hay empresas como UiPath trabajando con él, y se abrirá a más desarrolladores este verano.
En paralelo, Google anuncia la integración del Modo Agente en su app de Gemini, con acceso a herramientas externas mediante el protocolo MCP y funciones como concertar visitas inmobiliarias directamente desde Zillow.
Búsqueda con Modo IA y personalización avanzada
Google reinventa la experiencia de búsqueda con el Modo IA, que permite hacer preguntas complejas, mantener conversaciones y recibir respuestas generadas por Gemini 2.5. También se lanzan las Respuestas Inteligentes personalizadas en Gmail, que utilizan el contexto de tu cuenta (si lo permites) para redactar emails que suenan como si los hubieras escrito tú.
IA creativa: Veo 3, Imagen 4 y Canvas
Por el lado multimedia, en Google I/O 2025 se presentó Veo 3, el nuevo modelo de generación de vídeo con audio nativo, y Imagen 4, que mejora aún más la creación de imágenes por IA. Ambos están integrados en la app de Gemini.
También se presentó Flow, una herramienta pensada para creadores audiovisuales que saca partido del nuevo modelo de vídeo Veo 3. Con Flow, es posible generar clips cinematográficos directamente desde una idea inicial, extender escenas ya creadas o combinar fragmentos para construir una narrativa visual coherente y fluida, todo con la ayuda de la IA.
Además, Canvas se potencia con nuevas capacidades: ahora permite crear infografías, cuestionarios e incluso pódcasts multilingües con un solo clic. Y gracias al “vibe coding”, cualquiera puede desarrollar aplicaciones simplemente charlando con la IA.
Project Aura
Google también anunció Project Aura, un nuevo dispositivo Android XR en forma de gafas inteligentes inmersivas, en asociación con Xreal.
No dieron muchos detalles, aunque se parece a otras gafas de Xreal, como las Xreal One, que nos permiten conectarle un teléfono o un portátil y ver lo que esté en pantalla, pudiendo ajustar la opacidad para así ver más o menos de lo que nos rodea.
Obviamente también integrará Gemini, pero tendremos que esperar algo más para conocer en detalle lo que nos espera con estas gafas.
Más información en el blog oficial de Google.