Google quiere convertir a Gemini en el sistema operativo de la vida digital

Presenta en Google I/O 2026 nuevos modelos, agente personal, gafas inteligentes y la integración de IA en todo su ecosistema.

Miguel A. Román

may 20, 2026

¿Qué pasó ayer? En un minuto:

Google centra su I/O 2026 en Gemini como capa transversal: nuevos modelos, agentes personales y rediseño de todos sus productos.
Google presenta Gemini 3.5 Flash, que supera a 3.1 Pro en la mayoría de benchmarks y se despliega gratis a nivel global en los planes existentes.
Andrej Karpathy se incorpora a Anthropic para volver a hacer I+D, reforzando la capacidad de atracción de talento clave frente a OpenAI, Google y Meta.
Google presenta Gemini Omni, un ambicioso modelo multimodal nativo que debuta con Omni Flash para generación y edición conversacional de vídeo.
Google publica Antigravity 2.0 con aplicación de escritorio, consola y SDK propio para utilizar sus agentes, apoyado en Gemini 3.5 Flash.
OpenAI lanza Guaranteed Capacity: tokens con descuento y reserva de cómputo a cambio de contratos de 1 a 3 años, a la espera de escasez prolongada de capacidad.
Google lleva su agente personal Gemini Spark a la app de Gemini para macOS, trasladando al escritorio la competición con Microsoft y Apple.
Google estrena este otoño sus primeras gafas con Gemini, diseñadas por Gentle Monster y Warby Parker para competir con las Ray-Ban Meta.
Google DeepMind estrena Gemini for Science, que aplica Gemini al flujo investigador completo: revisión de literatura, generación de hipótesis y descubrimiento computacional sobre AlphaEvolve.
El ensayo 'The Bitter Lesson' de Richard Sutton vuelve al centro del debate: ¿basta con escalar cómputo y datos, o hay que incorporar conocimiento humano? La respuesta condiciona dónde se asigna el capital de I+D en los próximos años.

Y si tienes más de un minuto…

1. Google I/O 2026: Gemini en el centro de Google

Google ha abierto I/O 2026 en Mountain View con una keynote monopolizada por Gemini y por la redefinición del asistente como pieza central del ecosistema Google. Entre los anuncios, además de los lanzamientos de Gemini 3.5 Flash y Gemini Omni, destaca un rediseño de la app de Gemini utilizando el lenguaje ‘Neural Expressive’ que ellos mismos han creado para la interacción con la IA y dos productos agénticos: Daily Brief, que genera un resumen proactivo del día, y Gemini Spark, un agente capaz de ejecutar tareas de forma autónoma al estilo de OpenClaw, dentro del ecosistema de Google y con soporte para conectores MCP.

Una capa de Generative UI que aterrizará en Google Search este verano, generando código con interfaces de información dinámicas en lugar de listados de enlaces. También ha presentado la funcionalidad ‘Ask YouTube’ y ‘Ask Maps’, una capa conversacional para buscar dentro de la plataforma en lenguaje natural. Además, Sundar Pichai confirmó la reorganización de planes: Gemini Ultra baja de 250 a 200 dólares al mes y aparece un escalón nuevo de 100. Completan la lista avances en Android XR, gafas inteligentes, Android 17 con IA proactiva y la interoperabilidad de Quick Share con AirDrop.

La lectura competitiva es que Google está quedándose con capas de aplicación que hasta ahora alimentaban a startups (asistentes, agentes, edición de vídeo, búsqueda vertical) y aprieta a OpenAI, Anthropic y Microsoft en varios frentes simultáneos, con la gran ventaja de ser el dueño del ecosistema de los usuarios. Google I/O 2026 constata que el ritmo de publicación de nuevas funcionalidades se acelera en favor de los grandes.

Más información:

📎 Google I/O 2026: Sundar Pichai’s opening keynote

📎 How to watch Google I/O 2026 and what to expect

2. Google estrena Gemini 3.5 Flash en I/O

Google ha presentado en el I/O 2026 la familia Gemini 3.5, que describe como inteligencia de frontera con acción, orientada a flujos de trabajo agénticos de varios pasos. El despliegue arranca con 3.5 Flash, disponible de forma global y gratuita en la app de Gemini, en el AI Mode de Google Search y vía API para desarrolladores. La versión Pro llegará el mes que viene. Según Google, 3.5 Flash supera al anterior 3.1 Pro en la mayoría de benchmarks, con avances claros en programación y agentes, y se sitúa hasta cuatro veces por encima en velocidad (tokens por segundo) frente a modelos frontera comparables.

El movimiento encaja con la estrategia de comprimir en variantes baratas capacidades antes reservadas al gama alta, y de empujar el catálogo desde el chatbot hacia agentes autónomos que operan sobre código, navegadores y herramientas del ecosistema de Google. El precio sube a 1,50 dólares por millón de tokens, tres veces más que la versión anterior Flash pero por debajo de la versión Pro anterior que sobre el papel es inferior en prestaciones. En los próximos días veremos cómo se compara este modelo con los de su competencia directa, Claude 4.7 y GPT-5.5, y qué capacidades tendrá la versión Pro cuando salga el próximo mes.

𝕏 @sundarpichai (Sundar Pichai) subraya que 3.5 Flash bate a 3.1 Pro en casi todos los benchmarks, un mensaje deliberado: Google quiere que el mercado lea Flash como modelo de gama alta, no como variante ligera.

Desde el lado cliente, 𝕏 @levie (Aaron Levie) aporta una métrica concreta: en la evaluación interna de Box sobre tareas complejas con documentos, el modelo gana 12 puntos porcentuales frente a Gemini 3 Flash, una mejora difícil de despachar como incremental.

Para 𝕏 @JeffDean (Jeff Dean), la clave no es la potencia bruta sino la combinación con velocidad, una lectura coherente con la apuesta de Google por agentes que necesitan latencia baja para encadenar pasos sin romper la experiencia.

Más información:

📎 Gemini 3.5: frontier intelligence with action

3. Karpathy ficha por Anthropic

Andrej Karpathy, cofundador de OpenAI y exresponsable de IA en Tesla, ha anunciado su incorporación a Anthropic para volver a tareas de I+D en la frontera de los modelos de lenguaje. Según TechCrunch, Forbes, The New Stack y VentureBeat, su destino sería el equipo de pre-entrenamiento de Claude, el modelo insignia de la casa. El movimiento coloca a una de las figuras técnicas y divulgativas más reconocidas del sector en el núcleo del principal rival directo de OpenAI.

Karpathy también ha dejado abierta la intención de retomar más adelante su trabajo educativo, la faceta que le ha dado visibilidad fuera de los laboratorios. La operación llega mientras Anthropic acelera el despliegue empresarial de Claude Code. Para el sector, refuerza dos lecturas: el talento fundacional sigue siendo escaso y altamente móvil, y Anthropic ha consolidado tracción frente a OpenAI, Google DeepMind y Meta en la competición por atraerlo. Y por otro lado, trabajar al lado de Karpathy es el mejor reclamo para siga captando al mejor talento en sus filas. El salto que ha dado Anthropic en 2026 en todos los frentes (producto, adopción, inversión y talento) era inimaginable hace tan solo un año.

𝕏 @karpathy (Andrej Karpathy) enmarca su decisión como una vuelta deliberada a la I+D tras años de divulgación y proyectos personales, y considera que los próximos años en LLMs serán los más decisivos técnicamente.

Desde OpenAI, 𝕏 @polynoamial (Noam Brown) admite que habría preferido verlo regresar, pero rechaza leer el fichaje como suma cero entre laboratorios, una postura poco habitual en un mercado donde cada salida se interpreta como derrota competitiva.

Para 𝕏 @WesRoth (Wes Roth), la incorporación encaja en una racha de tracción de Anthropic con Project Glasswing y su empuje empresarial, y consolida la percepción de la compañía como polo de talento técnico de primer nivel.

Más información:

📎 OpenAI Cofounder Andrej Karpathy Joins Rival Anthropic - Forbes

4. Google lanza Gemini Omni para vídeo

Google DeepMind ha presentado en I/O 2026 Gemini Omni, un modelo multimodal nativo que razona sobre texto, imagen, audio y vídeo. Debuta con Omni Flash, centrado en generación y edición conversacional de vídeo, y se posiciona como primer paso hacia un sistema any-to-any, con otras salidas (imagen, audio) previstas más adelante. El despliegue arranca hoy en la app de Gemini, Google Flow y YouTube Shorts, e incluye a los suscriptores de Google AI Plus, Pro y Ultra; la API llegará en las próximas semanas.

Conceptualmente, Google lo plantea como el equivalente de Nano Banana para vídeo: edición semántica por instrucciones, mejor consistencia de personajes entre planos, comprensión de la física y conocimiento contextual heredado de Gemini. En Google Flow lo acompañan agentes por cada fase del proceso creativo, apps móviles y Flow Music con Lyria 3 Pro. Todos los vídeos llevan marca de agua SynthID para trazabilidad. Google deja de competir solo en generación desde cero, al estilo Veo o Kling, y entra en edición controlable, terreno donde están posicionados Runway o Pika.

Para 𝕏 @demishassabis (Demis Hassabis), Omni es un salto en comprensión del mundo y edición multimodal porque permite partir de fotos, vídeo o audio del propio usuario y construir escenas nuevas iterando sobre ellas, no solo generar desde un prompt en blanco.

𝕏 @sundarpichai (Sundar Pichai) insiste en que el diferencial no es el fotorrealismo sino el razonamiento sobre qué debería pasar a continuación en una escena, apoyándose en la física intuitiva y el conocimiento histórico y cultural de Gemini.

𝕏 @DotCSV (Carlos Santana) avisa de un malentendido frecuente: comparar Omni con Seedance 2.0 no encaja, porque la propuesta de Google no es competir en generación pura sino abrir un terreno nuevo de edición de vídeo conversacional al estilo Nano Banana.

Más información:

📎 Introducing Gemini Omni

📎 Introducing Gemini Omni for Google Flow and Flow Music

5. Antigravity 2.0 reordena el desarrollo con agentes

Google DeepMind ha presentado en Google I/O 2026 Antigravity 2.0, una plataforma de desarrollo con agentes que abandona el formato de extensión para convertirse en aplicación de escritorio independiente, con una interfaz de comandos propia y un SDK para que software de terceros se conecte a su IA. La compañía la describe como un ‘mission control’ donde varios agentes trabajan en paralelo sobre un mismo proyecto, con ejecución gestionada, soporte empresarial e integración con Gemini 3.5 Flash.

A ello se suma el hackathon ‘Build with Gemini XPRIZE’, dotado con 2 millones de dólares en premios. El conjunto sitúa a Google en competencia directa con Cursor, GitHub Copilot, Claude Code y Codex en el terreno del agentic coding, con el mismo objetivo de desplazar al desarrollador hacia tareas de supervisión y arquitectura.

Para 𝕏 @testingcatalog (Ai News | Testingcatalog), el salto de Gemini 3.5 Flash sobre Antigravity, hasta 12 veces más rápido, es el dato que convierte la plataforma en algo utilizable a diario y no en una demo de keynote.

𝕏 @emollick (Ethan Mollick) detecta una divergencia incómoda: mientras OpenAI y Anthropic acercan chat y entornos de código a una experiencia única, Google multiplica superficies (Studio, Gemini, Antigravity) sin que se vea cuál debería imponerse dentro de su propio catálogo.

📎 Developer highlights from I/O 2026

6. OpenAI vende capacidad garantizada a cambio de compromisos plurianuales

OpenAI ha presentado Guaranteed Capacity, una oferta que permite a clientes empresariales asegurar acceso a cómputo a cambio de compromisos de consumo de uno a tres años. El esquema combina dos piezas: tokens con descuento escalonado según la duración del contrato y reserva efectiva de capacidad para cargas críticas, con opción de repartir el gasto comprometido entre distintas familias de modelos. La compañía justifica el movimiento por una previsión explícita de escasez prolongada de cómputo a medida que los modelos ganan utilidad y la demanda crece más rápido que la capacidad instalada.

La mecánica recuerda a los contratos take-or-pay habituales en infraestructura: el aprovisionamiento de IA deja de ser consumo elástico y se acerca al modelo de energía, con previsibilidad pagada por adelantado. Para OpenAI, los compromisos plurianuales aportan visibilidad de ingresos para sostener su plan de centros de datos y GPUs, y refuerzan la dependencia operativa frente a alternativas como AWS Bedrock o Vertex AI. En paralelo, la compañía ofrece 2 millones de dólares en créditos de API a cada startup de la actual hornada de Y Combinator, una vía para captar consumo temprano sin tocar la asignación reservada.

𝕏 @sama (Sam Altman) admite que la escasez de cómputo va para largo y presenta los contratos como herramienta de planificación interna tanto como de ingreso, lo que sugiere que OpenAI necesita esa visibilidad para dimensionar su próxima ola de capex.

𝕏 @gdb (Greg Brockman) traslada el riesgo al cliente con claridad: quien quiera certidumbre paga por ella con un compromiso de uno a tres años, normalizando en IA los contratos plurianuales que ya existen en cloud y semiconductores.

𝕏 @khouuba (Khouba) interpreta el lanzamiento como confirmación de que el acceso a cómputo dejó de ser commodity: los builders necesitan capacidad garantizada para cargas críticas, lo que abre hueco a capas neutrales entre proveedores.

7. Gemini Spark llega al escritorio

Google ha detallado en Google I/O 2026 cómo desplegará Gemini Spark, su agente personal 24/7, dentro de la app de Gemini para macOS lanzada el mes pasado. La integración llegará en las próximas semanas y permitirá tareas locales como organizar archivos del usuario o extraer datos de PDFs directamente a Google Sheets, con control por voz para reformatear y mover texto entre aplicaciones sin teclear. El despliegue se acompaña de un rediseño de Gemini Live, que ahora se abre dentro de la app y filtra mejor el ruido de fondo. Spark llegará primero a testers de confianza y después a usuarios Ultra en EE. UU., con soporte para MCPs y conectores.

Google traslada la lógica agéntica del móvil al sistema operativo, terreno donde Copilot en Windows y Apple Intelligence en MacOS quieren marcar la diferencia. Al elegir macOS como puerta de entrada al escritorio, ataca de frente al usuario profesional de Mac antes el corporativo de Windows. Queda por concretar qué porcentaje de tareas resolverá Spark sin supervisión, cómo gestionará permisos sobre datos personales y cuándo se extenderá fuera de EE. UU. y del plan Ultra.

El equipo de 𝕏 @GeminiApp (Google Gemini) enmarca la llegada de Spark a macOS como un paso hacia tareas locales concretas, no hacia un chatbot más capaz. Eso delimita la ambición del producto: productividad de escritorio frente a conversación pura.

Que 𝕏 @Google (Google) insista en que Gemini Live se abre dentro de la app y filtra mejor el ruido sugiere que la compañía ve la conversación continua, no el prompt aislado, como la interfaz por defecto del agente.

Para 𝕏 @BruceBlue (Bruceblue), la señal real del I/O es que Gemini deja de ser chatbot para convertirse en un Agent OS: Spark cubre la capa personal, Antigravity el desarrollo y Omni el vídeo.

8. Google llevará Gemini a gafas inteligentes

Google ha adelantado en Google I/O 2026 su entrada en gafas inteligentes con Gemini integrado y lanzamiento previsto para este otoño. El primer producto serán unas gafas de audio sin pantalla, orientadas a asistencia manos libres, acompañadas de acuerdos con Samsung, Gentle Monster y Warby Parker para fabricar y distribuir distintos diseños. La estrategia separa dos vías: un dispositivo de entrada centrado en voz y audio, y modelos más cuidados de la mano de marcas de moda y ópticas, un camino que recuerda al de Meta con Ray-Ban y EssilorLuxottica.

La apuesta encaja con el resto del evento, donde Gemini se presenta como capa transversal que pasa del móvil al escritorio y ahora al cuerpo, apoyada en Android XR. Con ello, Google se mete de lleno contra unas Ray-Ban Meta que ya han fijado expectativas de volumen, y adelanta posiciones ante un posible hardware de OpenAI con Jony Ive o la integración de Apple Intelligence en los dispositivos de Apple. El modelo de alianzas con marcas de moda sustituye, de momento, a un wearable propio fuerte, y el despliegue fuera de EE. UU. sigue sin calendario.

9. Google DeepMind lanza Gemini for Science

Google DeepMind ha presentado en Google I/O 2026 Gemini for Science, una suite experimental desarrollada con Google Research, Google Labs y Google Cloud. Cubre tres frentes: análisis y síntesis de literatura académica mediante NotebookLM, generación y evaluación de hipótesis con Co-Scientist, y un prototipo agéntico de descubrimiento computacional sobre AlphaEvolve. Co-Scientist organiza un torneo multiagente que propone, debate y descarta hipótesis dejando trazabilidad del razonamiento. El bloque de AlphaEvolve genera y puntúa miles de variantes de código en paralelo, con la epidemiología como caso de uso de referencia.

La iniciativa extiende la línea de DeepMind en ciencia, que ya tenía AlphaFold como antecedente, pero esta vez ataca el flujo investigador completo, no un dominio aislado. Quedan abiertas cuestiones operativas relevantes: disponibilidad, modelo de acceso para laboratorios académicos o la integración con bases de conocimiento científico como PubMed o UniProt.

𝕏 @pushmeet (Pushmeet Kohli) firma la apuesta interna y enmarca el lanzamiento como el inicio de una etapa en la que los agentes de IA actúan como multiplicadores del trabajo humano, no como sustitutos. Es una matización deliberada para evitar el choque con la comunidad académica.

Tras probarla en preview, 𝕏 @emollick (Ethan Mollick) sitúa a Google como el laboratorio que más en serio se está tomando la IA aplicada a investigación, aunque advierte de un sesgo claro hacia biociencias que deja cojas a las ciencias sociales.

Que 𝕏 @GoogleForHealth (Google For Health) amplifique el lanzamiento revela el vector real de monetización: la división sanitaria quiere convertir Gemini for Science en puerta de entrada a hospitales y farmacéuticas, donde ya compite con NVIDIA BioNeMo y con las herramientas internas de las grandes farmas.

𝕏 @GoogleDeepMind (Google Deepmind) insiste en que Co-Scientist no solo propone hipótesis, sino que muestra cuáles funcionan y por qué. Es un encuadre pensado para responder por adelantado a la crítica habitual sobre alucinaciones en sistemas de razonamiento científico.

Más información:

📎 Nuevas herramientas de IA para el futuro de la ciencia

10. El debate sobre la Bitter Lesson se reabre

El ensayo 'The Bitter Lesson', publicado por Richard Sutton en 2019, ha vuelto a la conversación tras varias intervenciones críticas en X. La tesis sostiene que, a lo largo de la historia de la IA, los métodos generales que escalan con cómputo y datos acaban superando a los que incorporan conocimiento humano específico. Esa lectura se ha consolidado como justificación implícita del escalado masivo de LLMs en OpenAI, Anthropic o Google DeepMind.

La crítica actual ataca por dos flancos. Uno sostiene que los modelos no comprenden el mundo y no operan bajo restricciones físicas como un agente en contacto con el mundo, por lo que añadir restricciones cognitivas en el diseño es preferible a esperar que el escalado las resuelva. El otro recuerda que ningún sistema desplegado valida la tesis de Bitter Lesson en estado puro: arquitecturas, tokenizadores, funciones de pérdida, datos curados, RLHF y andamiajes de inferencia incorporan conocimiento humano en cada capa. El debate no es solo teórico. Decide si el capital de investigación sigue empujando cómputo y datos o reforzando líneas neuro-simbólicas, world models y alineamiento. Con contratos plurianuales de capacidad ya firmados y despliegues comerciales en marcha, lo que se juega es qué mezcla de escalado y conocimiento incorporado ofrece mejor retorno por dólar de cómputo entre 2026 y 2027.

Para 𝕏 @MLStreetTalk (Machine Learning Street Talk), Sutton puede acabar teniendo razón a largo plazo, pero los modelos actuales no entienden nada ni están sujetos a restricciones físicas, así que conviene añadir ya restricciones de comprensión humana en lugar de esperar a que el escalado resuelva el problema. Añade que ningún sistema desplegado hoy valida la Bitter Lesson en su aplicación más estricta, porque todos incorporan conocimiento humano parcial en múltiples capas.

Desde la divulgación, 𝕏 @mark_k (Mark Kretschmann) defiende la lectura clásica: el patrón histórico muestra que el conocimiento humano artesanal pierde frente a métodos generales que escalan, una idea que sigue funcionando como justificación implícita del capex en cómputo.

Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.

Discusión sobre este post

Por supuesto, sigue adelante.