OpenAI, Anthropic y Google participan en la cumbre del G7
El debate geopolítico de IA está marcado por la reciente suspensión de Fable/Mythos.
¿Qué pasó ayer? En un minuto:
Los CEOs de OpenAI, Anthropic y Google DeepMind participan en el G7 para guiar las conversaciones sobre gobernanza de IA. Amodei y Hassabis piden una coalición internacional de IA liderada por Estados Unidos, con reglas comunes entre aliados.
OpenAI presenta LifeSciBench, un benchmark para medir la utilidad real de la IA en biociencias, y muestra cómo sus modelos ayudan a completar ciclos de investigación en química medicinal con resultados validados en laboratorio.
Midjourney crea una división de Medicina y lanza su primer producto de hardware: Midjourney Scanner, un escáner corporal por ultrasonidos planteado como alternativa a la resonancia.
Noam Shazeer, coautor del paper que dio origen a los Transformers y hasta ahora co-responsable de Gemini, deja Google para incorporarse a OpenAI, menos de dos años después de que Google pagara 2.700 millones por recuperarlo.
GLM-5.2 se convierte en el mejor modelo de pesos abiertos medido hasta ahora: 51 puntos en el Artificial Analysis Intelligence Index.
Anthropic actualiza Claude Design: ahora construye con los componentes reales del equipo y verifica su salida contra el sistema de diseño antes de mostrarla.
xAI lleva Grok 4.3 a Amazon Bedrock, sacando el modelo de los entornos propios de xAI y suma otro laboratorio frontera al catálogo multimodelo de Amazon.
Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.
Y si tienes más de un minuto…
1. Amodei y Hassabis piden una coalición de IA liderada por EE. UU.
Los líderes de OpenAI, Google DeepMind y Anthropic llevaron al G7 un mensaje incómodo: la inteligencia artificial avanza más rápido que la capacidad política para gobernarla. Sam Altman, Demis Hassabis y Dario Amodei coincidieron en que los gobiernos deben actuar ya, pero discreparon sobre el modelo. Amodei y Hassabis habrían instado a los líderes del G7 a crear una coalición internacional de IA liderada por Estados Unidos. Según lo reportado, agruparía a países aliados con dos cometidos: coordinar reglas y estándares para la IA avanzada y ayudar a esos países a desarrollar o adoptar la tecnología. Lo interesante es que quién lo propone no son gobiernos ni reguladores, sino dos responsables de los laboratorios que construyen los modelos más capaces, pidiendo un marco común entre democracias en lugar de normativas nacionales dispersas.
El planteamiento enlaza con una inquietud recurrente en el sector: el acceso a un modelo potente puede cortarse de un día para otro. Cualquier país que monte servicios esenciales sobre sistemas de IA extranjeros, sin alternativas, asume un riesgo de dependencia. Una coalición con estándares compartidos buscaría reducir esa exposición y ordenar la competencia geopolítica en torno a la seguridad de los modelos frontera. Por el momento no existe un comunicado oficial del G7 ni de las propias empresas sobre medidas concretas.
El peso de la propuesta, para 𝕏 @WesRoth (Wes Roth), está en el perfil de quienes la firman: que sean Amodei y Hassabis, y no los reguladores, quienes pidan coordinación entre aliados marca el tono del debate sobre gobernanza de la IA avanzada.
Desde el escepticismo, 𝕏 @SemiAnalysis_ (Semianalysis) ironiza con un supuesto ‘Comité del Estado Profundo del G7’ reunido en Francia para decidir el futuro de la IA occidental, un recordatorio de la distancia entre la retórica de coordinación y cualquier decisión real.
2. OpenAI lleva la IA al laboratorio biocientífico
OpenAI ha presentado LifeSciBench, un benchmark para medir cuánto ayuda la IA en investigación de ciencias de la vida. Lo ha desarrollado con Tacit Labs y 173 científicos de biotecnología y farmacia, con 750 tareas en siete áreas de biología. El enfoque lo separa de las pruebas habituales: no evalúa conocimiento memorístico, sino si los modelos razonan sobre evidencia, manejan artefactos científicos, gestionan la incertidumbre y deciden bajo restricciones reales. En esas tareas, un modelo llamado GPT-Rosalind especializado en biología supera a GPT-5.5.
En paralelo, OpenAI describe un caso práctico: GPT-5.4, junto a la plataforma Maria AI de Molecule.one y un laboratorio externo, recorrió un proyecto de química medicinal desde la revisión bibliográfica hasta un resultado validado, con una mejora inesperada a una reacción química que es habitual en descubrimiento de fármacos. Maria evaluó 10.080 reacciones; bajo condiciones optimizadas, el rendimiento mejoró en el 88% de los ácidos borónicos y el 83% de las sulfonamidas analizadas, y químicos repitieron a mano 14 resultados representativos. El proyecto duró unos 2,5 meses, más medio mes adicional para que los químicos redactaran los resultados. Este proyecto encaja con un patrón comercial: un plan ChatGPT for Science dirigido a universidades, laboratorios nacionales y grupos de I+D corporativos.
𝕏 @OpenAI (Openai) defiende que el valor del benchmark está en alejarse del conocimiento aislado y medir decisiones útiles bajo condiciones reales, justo donde GPT-Rosalind se separa de GPT-5.5.
Para 𝕏 @WesRoth (Wes Roth) lo destacable es que GPT-5.4 no se limitó a resumir papers ni a proponer una teoría plausible, sino que completó un ciclo de investigación entero, desde detectar el problema hasta diseñar los experimentos.
𝕏 @gdb (Greg Brockman) enmarca estos casos como motivo concreto de entusiasmo: ayudar a resolver problemas de salud reales, más allá de la promesa abstracta.
𝕏 @dreidco (Dylan Reid) sitúa el problema de fondo donde más duele en biología, la falta de buenos verificadores, y celebra LifeSciBench precisamente por intentar cubrir ese hueco.
𝕏 @alanaagoyal (Alana Goyal) lee el lanzamiento como la construcción del bucle de verificación que le faltaba a la biología, atribuyendo el mérito al equipo de Tacit Labs detrás del benchmark.
Más información:
📎 A near-autonomous AI chemist improves a challenging reaction in medicinal chemistry
3. Midjourney entra en imagen médica con Scanner
Midjourney, conocida por su generador de imágenes con IA, ha presentado su primer producto de hardware y ha creado una división nueva, Midjourney Medical. El producto, Midjourney Scanner, es un escáner corporal por ultrasonidos que, según la compañía, captura el cuerpo completo (hasta las arterias) sumergiéndose en agua, como alternativa a la resonancia magnética. La empresa lo plantea como un intento de replantear la imagen médica, un terreno alejado de su software creativo. El anuncio llegó con una explicación técnica publicada por la propia Midjourney y un livestream.
El salto no es menor: la medicina exige validación clínica, garantías de privacidad y aprobaciones regulatorias muy por encima de las del software de generación visual, y un dispositivo de diagnóstico necesita autorizaciones específicas antes de su uso real. Más allá del escáner, según versiones recogidas en X, Midjourney trabajaría en otros cuatro proyectos de hardware y cuatro de software, lo que sugiere una diversificación amplia. La compañía no ha aclarado el estado regulatorio del dispositivo ni los plazos de cualquier despliegue clínico.
El alcance lo amplía 𝕏 @testingcatalog (Ai News | Testingcatalog), que sitúa el escáner como la punta del plan: además del hardware, habla de cuatro proyectos de hardware y cuatro de software en marcha bajo Midjourney Medical.
Tras probarlo, 𝕏 @benparr (Ben Parr) lo describe como la primera reinvención de la imagen médica en décadas: en vez de una hora en una resonancia, basta sumergirse en agua para obtener ultrasonido de todo el cuerpo hasta las arterias.
Desde una mirada clínica, 𝕏 @artisin_ai (G. Kim), con experiencia en neurociencia, recibe bien la iniciativa pero pone el listón donde toca: quiere ver el estudio revisado por pares antes de sacar conclusiones.
𝕏 @austinvhuang (Austin Huang) recuerda que pronosticar este tipo de productos es mucho más fácil que construirlos, y reconoce el mérito de Midjourney y David Holz por asumir el reto.
4. Noam Shazeer ficha por OpenAI
Noam Shazeer, hasta ahora co-responsable de Gemini en Google DeepMind, se incorpora a OpenAI. Lo confirmaron desde dentro Sam Altman y el investigador Noam Brown, que dio la bienvenida pública a su nuevo compañero. Altman lo presentó como un objetivo perseguido desde la fundación de la empresa, hace diez años. El peso de Shazeer en el campo es difícil de exagerar: figura entre los autores de 'Attention is All You Need', el artículo de 2017 que introdujo la arquitectura Transformer, base de los modelos de lenguaje actuales. También participó en avances posteriores como Sparse MoE, Switch Transformer y Multi-Query Attention, técnicas que hoy sostienen buena parte del stack de los grandes modelos.
Su salida llega poco después de que Google pagara una suma considerable para recuperarlo a finales de 2024, cuando readquirió Character.AI, la startup que él había cofundado tras dejar Google por primera vez. El fichaje refleja la competencia abierta por un grupo reducido de investigadores capaces de marcar la dirección técnica de un laboratorio frontera, y coincide con los preparativos de OpenAI para una posible salida a bolsa, según las versiones que circulan. Por ahora no se ha detallado el cargo de Shazeer dentro de OpenAI, su área de trabajo ni las condiciones del acuerdo.
El propio 𝕏 @sama (Sam Altman) sitúa a Shazeer como una de las personas con las que más había querido trabajar desde el arranque de OpenAI, una espera de diez años que, asegura, valdrá la pena.
Desde el equipo de investigación, 𝕏 @polynoamial (Noam Brown) celebra el fichaje con un guiño a su propio nombre, dando la bienvenida a otro 'Noam' a la casa.
Para 𝕏 @himanshustwts (Himanshu) el calado del fichaje está en el historial técnico: pocos han contribuido a tantas ideas fundacionales del stack moderno de LLM, desde la atención hasta los MoE dispersos.
𝕏 @CodeByPoonam (Poonam Soni) subraya la paradoja económica: Google desembolsó 2.700 millones de dólares para recuperarlo y lo pierde menos de dos años después.
5. GLM-5.2 lidera el segmento open-weight
Z.ai ha presentado GLM-5.2, su nuevo modelo de pesos abiertos orientado a programación, agentes y tareas de larga duración. Obtiene 51 puntos en el Artificial Analysis Intelligence Index y queda cuarto en la clasificación general, el mejor resultado open-weight registrado hasta la fecha. Supera a GLM-5, que marcaba 50 y ya lideraba el segmento, y la progresión es notable: GLM-4.7 partía de 42 puntos. En código, GLM-5.2 Max queda segundo en Frontend Code Arena, solo por detrás de Claude Fable 5, que figura como no disponible.
El efecto para el sector es directo. Cada vez que un modelo abierto se acerca a los líderes cerrados, sube la presión sobre los proveedores propietarios y se amplían las opciones para quien despliega modelos propios, sobre todo en desarrollo frontend. Conviene matizar el alcance. Esos 51 puntos igualan la marca de GPT-5.4 xhigh, un modelo que era frontera hace tres meses, así que GLM-5.2 alcanza ahora un nivel que el cierre ya dejó atrás. Z.ai vende el acceso mediante planes de suscripción desde 18 dólares al mes.
Para 𝕏 @testingcatalog (Ai News | Testingcatalog) el resultado tiene doble lectura: GLM-5.2 entra en el top 4 general y, a la vez, queda segundo en Frontend Code Arena por detrás de un Claude Fable 5 que ni siquiera está disponible, lo que en la práctica lo deja al frente del código frontend accesible.
𝕏 @levie (Aaron Levie) coloca el debate donde decide el mercado: la distancia entre modelos abiertos y cerrados. Un desfase de tres a seis meses favorece la competencia y el despliegue propio; uno de años concentraría el poder en unos pocos laboratorios cerrados.
𝕏 @emollick (Ethan Mollick) aporta el matiz que los benchmarks no recogen: en una prueba creativa, GLM-5.2 produjo un poema correcto, pero Fable integró la mecánica de las letras que desaparecen en la propia temática del poema, una sutileza que ningún índice numérico capta.
Desde 𝕏 @arena (Arena.Ai) subrayan que GLM-5.2 Max es el mejor resultado de pesos abiertos que han medido en su clasificación de agentes, con +9,4% en éxito confirmado.
6. Anthropic refuerza Claude Design
Anthropic ha renovado Claude Design, su herramienta de diseño de interfaces asistida por IA. La versión nueva amplía el soporte para sistemas de diseño, suma un editor tipo canvas con controles para arrastrar y redimensionar, y se sincroniza con Claude Code. El cambio de fondo está en cómo trabaja el modelo. Antes generaba pantallas a partir de una descripción; ahora construye con los componentes reales del usuario y contrasta su propia salida con el sistema de diseño antes de enseñarla.
La sincronización con Claude Code busca un recorrido continuo entre diseño y código, con idas y vueltas entre ambas fases. El objetivo es reducir las desviaciones habituales respecto a las guías de estilo en equipos de producto. Con ello, Anthropic entra de lleno en un terreno donde ya operan herramientas especializadas. La actualización corrige además el consumo elevado de tokens que lastraba la versión anterior.
El avance, para 𝕏 @testingcatalog (Ai News | Testingcatalog), es que Claude deja de improvisar pantallas: construye con los componentes reales del equipo y revisa su propio resultado frente al sistema de diseño antes de mostrarlo.
La distancia con la versión anterior la marca 𝕏 @rohanpaul_ai (Rohan Paul), que la describe como un generador visual a partir de una descripción y destaca la importación de sistemas de diseño y el arreglo del consumo excesivo de tokens.
Desde Japón, 𝕏 @BitoFCE (Ai×→) resume el cambio como un flujo de diseño a código sin costuras: salida coherente entre proyectos, edición directa sobre el canvas y sincronización en tiempo real con Claude Code.
7. Grok 4.3 llega a Amazon Bedrock
xAI ha incorporado Grok 4.3 a Amazon Bedrock, el servicio gestionado de modelos de AWS. Los desarrolladores de la plataforma pueden ahora integrarlo en sus aplicaciones sin salir del entorno. Grok 4.3 es un modelo orientado al razonamiento, siempre activo y configurable en tres niveles de esfuerzo: bajo, medio y alto. La ficha del modelo en Bedrock destaca el uso de herramientas, el seguimiento de instrucciones para agentes multipaso y la eficiencia de tokens en inferencia de alto volumen. Entre los usos previstos figuran la revisión de contratos, la investigación de jurisprudencia y el análisis de documentos financieros.
El movimiento amplía la distribución de xAI más allá de sus propios entornos y refuerza la apuesta multimodelo de Amazon, que añade así otro proveedor frontera para competir por el desarrollador empresarial. La integración corre sobre Mantle, un motor de inferencia de Bedrock pensado para optimizar la relación precio-rendimiento, con soporte para tool calling, salida estructurada y respuesta en streaming. Según la documentación, el modelo ofrece una ventana de contexto de un millón de tokens.
El cambio de fondo, para 𝕏 @kakoji7777 (Kakoji), no es que Grok funcione en AWS, sino que pasa de chatbot de consumo a opción integrable dentro de sistemas empresariales.
El atractivo técnico está, según 𝕏 @tetsuoai (Tetsuo), en la combinación de contexto de un millón de tokens, esfuerzo de razonamiento configurable y tool calling nativo, todo tras una API compatible con OpenAI.
Desde el lado del desarrollador, 𝕏 @0x_sakata (Sakata) lo lee como una victoria para AWS: las empresas pueden enchufar Grok 4.3 en flujos de Bedrock ya existentes sin rehacer la integración.
Más información:



