Microsoft amplía la familia MAI con siete nuevos modelos para no depender de OpenAI
Se posiciona como un nuevo competidor de modelos frontera con el ajuste fino como elemento diferenciador.
¿Qué pasó ayer? En un minuto:
Microsoft anuncia siete modelos propios de la familia MAI, entre ellos su primer modelo de razonamiento de propósito general, MAI-Thinking-1, con la posibilidad de hacer ajuste fino con datos propios como ventaja competitiva.
La Casa Blanca firma una orden ejecutiva que une innovación en IA y seguridad nacional, con una regulación suave respaldada por los grandes laboratorios.
Google DeepMind muestra casos de uso de Co-Scientist, un sistema multiagente sobre Gemini que genera y debate hipótesis científicas.
OpenAI amplía los plugins de Codex para adaptarlo a cada función profesional: 62 aplicaciones y 110 skills con una sola instalación y sin escribir código.
Anthropic amplía el proyecto Glasswing a unas 150 organizaciones nuevas: los 50 socios iniciales ya han localizado más de 10.000 vulnerabilidades.
TinyFish lanza Bigset, un sistema multiagente de código abierto que construye un dataset estructurado y verificado, extraído de la web, a partir de instrucciones en lenguaje natural.
Zoox explica cómo entrena su conducción autónoma para los casos extremos que casi nunca aparecen en carretera: con simulación, no con kilometraje real.
Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.
Y si tienes más de un minuto…
1. Microsoft amplía su familia MAI con siete modelos
Microsoft ha presentado siete modelos propios de la familia MAI (Microsoft AI), disponibles en Microsoft Foundry para desarrolladores bajo un mismo marco de gobernanza y seguridad. El conjunto cubre razonamiento (MAI-Thinking-1), código (MAI-Code-1-Flash), generación y edición de imagen (MAI-Image-2.5 y su variante Flash), síntesis de voz (MAI-Voice-2 y MAI-Voice-2-Flash) y transcripción (MAI-Transcribe-1.5). El conjunto confirma la voluntad de la compañía de construir capacidades internas además de su alianza con OpenAI, reduciendo la dependencia de proveedores en su pila de productos.
La novedad más importante para diferenciarse de los laboratorios dominantes como OpenAI y Anthropic se llama Frontier Tuning, una vía para que las compañías adapten los modelos de IA a sus datos, procesos y normas internas dentro de sus propios límites de cumplimiento. También anuncia la disponibilidad de sus modelos en OpenRouter, Fireworks y Baseten para que cualquier desarrollador pueda hacer ajuste fino de los pesos de sus modelos de acuerdo a sus necesidades y uso cotidiano. Microsoft apuesta fuerte por esta vía para entregar modelos diez veces más eficientes y con las mismas prestaciones que los modelos más potentes.
MAI-Thinking-1, su primer modelo de razonamiento de propósito general, llega con un informe técnico extenso, algo poco habitual a esta escala en un sector cada vez más opaco. MAI-Transcribe-1.5 se sitúa primero en FLEURS, promediado en 43 idiomas, y en la frontera de Pareto de precisión y velocidad de Artificial Analysis. La línea de imagen distingue un nivel premium centrado en fidelidad, MAI-Image-2.5, y una versión Flash más ligera, patrón que se repite en voz. MAI-Image-2.5 debuta segundo en la categoría Single-Image-Edit del Arena por delante de Nano Banana y Grok Imagine. Sin embargo, la verificación externa de MAI-Thinking-1 es, por ahora, escasa: algunos benchmarks publicados resultan difíciles de interpretar, con resultados bajos en benchmarks populares como GPQA y Terminal Bench 2.0.
Para 𝕏 @mustafasuleyman (Mustafa Suleyman), el anuncio resume la apuesta de Microsoft como compañía de plataforma: lanzar modelos de primer nivel y, a la vez, dar herramientas para que los clientes los adapten a sus propios usos.
Más escéptico, 𝕏 @emollick (Ethan Mollick) advierte de que cuesta juzgar la calidad de MAI-Thinking-1 solo por sus cifras y critica la dificultad para probar los modelos de Microsoft justo tras su lanzamiento.
Desde el equipo, 𝕏 @tyleraromero (Tyler Romero) presenta MAI-Thinking-1 como el primer modelo de razonamiento de propósito general de Microsoft y subraya el informe técnico que detalla la ciencia y la ingeniería detrás.
𝕏 @baseten (Baseten) destaca un argumento práctico: MAI-Thinking-1 permitirá hacer ajuste fino sin ceder los datos a Microsoft y presume de un linaje de datos limpio, sin destilación de modelos de terceros.
Más información:
📎 Building a hill-climbing machine: Launching seven new MAI models
2. Trump firma orden ejecutiva sobre IA
La Casa Blanca ha emitido la orden ejecutiva 'Promoting Advanced Artificial Intelligence Innovation and Security', que persigue dos objetivos a la vez: acelerar la innovación en IA y reforzar la seguridad nacional ligada a estas capacidades. El texto atribuye el liderazgo estadounidense al talento de su industria y a una regulación deliberadamente ligera. La Administración encuadra la medida en su política 'America First' en ciberseguridad y reivindica haber retirado restricciones del Gobierno anterior a desarrolladores e investigadores.
Es una acción importante porque fija la dirección regulatoria del país justo cuando se debate cómo equilibrar despliegue rápido, seguridad y competencia con China. Gran parte de la industria ha reaccionado con apoyo, lo que anticipa una cooperación público-privada más estrecha en el desarrollo y la adopción de IA, dentro de agencias federales y en el sector privado. El documento también plantea modernizar los sistemas de información públicos y privados frente a amenazas externas. Las empresas de modelos son parte interesada en un marco que prioriza la velocidad sobre la carga regulatoria. La orden crea un proceso para que los laboratorios frontera compartan voluntariamente información o acceso a modelos avanzados con el Gobierno; la versión final recortó el alcance del borrador previo, al limitar ese acceso a un máximo de 30 días y descartar cualquier régimen obligatorio de licencia o preautorización.
El respaldo de 𝕏 @AnthropicAI (Anthropic) es notable: una de las grandes empresas de modelos califica la orden como un paso importante para el liderazgo estadounidense y se ofrece a colaborar en su implementación, un alineamiento explícito con la Administración.
Para 𝕏 @sama (Sam Altman), la orden 'logra el equilibrio adecuado' y resume el liderazgo en IA en tres palancas: mejores modelos, modelos seguros y herramientas cibernéticas en manos de 'defensores de confianza', una fórmula que sitúa la ciberseguridad en el centro.
Como portavoz del enfoque tecnológico del Gobierno, 𝕏 @DavidSacks (David Sacks) defiende un marco de innovación, energía e infraestructura como vía para ganar la carrera de la IA, y describe a Trump como el presidente más favorable a la innovación de la historia de EE. UU.
Más información:
📎 Promoting Advanced Artificial Intelligence Innovation and Security – The White House
3. DeepMind abre Co-Scientist a investigadores
Google DeepMind enseña casos de uso reales de Co-Scientist, un sistema multiagente basado en Gemini que se plantea como socio de investigación. Su función central es generar, debatir y refinar hipótesis ante problemas científicos complejos. La arquitectura reparte el trabajo entre varios agentes que contrastan ideas entre sí, en lugar de operar como un único modelo aislado.
Durante el último año, DeepMind afirma haber evaluado el sistema junto a expertos de varios países sobre casos reales: identificar nuevas dianas terapéuticas para la fibrosis hepática y proponer enfoques contra la esclerosis lateral amiotrófica (ELA), apoyándose en su capacidad para sintetizar décadas de literatura. El anuncio se enmarca en Gemini for Science, un conjunto de experimentos y herramientas de la compañía orientado al descubrimiento asistido por IA. La novedad es de acceso: Co-Scientist deja de limitarse a equipos cerrados y se abre a investigadores individuales.
La tesis que defiende 𝕏 @GoogleDeepMind (Google Deepmind) es que la IA puede actuar como socio dedicado de investigación, no solo como herramienta de análisis, capaz de aportar hipótesis nuevas en problemas donde el conocimiento previo está disperso.
Para 𝕏 @berryxia (Berryxia.Ai), el enfoque multiagente cambia el marco de la conversación: no se trata de qué puede hacer la IA por el científico, sino de convertir Gemini en un equipo de agentes que colaboran sobre un mismo problema.
Más información:
📎 Co-Scientist: A multi-agent AI partner to accelerate research — Google DeepMind
4. OpenAI convierte Codex en especialista por rol
OpenAI ha ampliado el sistema de plugins de Codex, su asistente de programación, para que funcione como un especialista según el rol del usuario en lugar de como herramienta de propósito general. Con una sola instalación y sin escribir código, Codex accede a 62 aplicaciones y 110 habilidades orientadas a tareas concretas, de ventas a análisis de datos. La compañía mostró complementos específicos, como un plugin de ventas y otro de inversión en renta variable pública, una señal de que busca llevar Codex más allá del desarrollo de software hacia flujos de trabajo de negocio.
El anuncio incluyó Sites para Codex, que transforma trabajo, ideas y planes en webs o apps interactivas accesibles por URL compartible, y Annotations, que permite seleccionar contexto en un documento y consultarlo directamente. El conjunto reposiciona a Codex como capa de integración con aplicaciones de terceros, no solo como generador de código, en línea con la tendencia de conectar agentes a herramientas reales para reducir la barrera de adopción. Sites, los plugins por rol y Annotations se despliegan en vista previa, primero para los planes Business y Enterprise.
Para 𝕏 @OpenAI (Openai), el objetivo es hacer Codex más útil en el trabajo diario sin exigir conocimientos de programación, adaptándolo a cada función profesional con una única instalación.
𝕏 @WesRoth (Wes Roth) lee el cambio como un paso de las herramientas aisladas hacia un ecosistema integrado de plugins, donde el valor está en la cobertura de aplicaciones y habilidades, no en una función concreta.
𝕏 @useapolloio (Apollo.Io) celebra estar entre los socios del lanzamiento y subraya el caso comercial: investigación de prospectos, planificación de cuentas y preparación de reuniones dentro de ChatGPT.
𝕏 @SemiAnalysis_ (Semianalysis) pone el foco en la experiencia de uso: considera que la app de escritorio y el navegador integrado de Codex ya son muy buenos, y apunta que con un mejor modelo base podría acercarse a Claude Code en su benchmark VibeMAX, donde hoy Claude lidera.
Más información:
📎 Codex for every role, tool, and workflow
5. Anthropic amplía Project Glasswing a 150 organizaciones
Anthropic ha ampliado Project Glasswing, su iniciativa para asegurar software crítico escaneando código con IA. El acceso a Claude Mythos Preview, un modelo orientado a detectar vulnerabilidades, llega ahora a unas 150 organizaciones nuevas en más de quince países. En abril participaban unos 50 socios iniciales, que desde entonces han localizado más de 10.000 fallos de severidad alta o crítica en sus bases de código. La expansión incorpora sectores ausentes en la primera tanda: energía, agua, sanidad, comunicaciones y hardware. Muchos socios son proveedores cuyas bases de código sostienen a numerosas organizaciones, incluidos gobiernos, lo que coloca el caso de uso en infraestructura de la que dependen terceros.
El interés está en llevar la IA generativa a un escenario de ciberseguridad concreto y a escala, donde la fiabilidad de las detecciones es el criterio decisivo: un escáner que genera ruido cuesta más de lo que ahorra. El movimiento coincide con un momento expansivo para la compañía: según el New York Times, Anthropic ha presentado documentación para salir a bolsa tras un fuerte crecimiento, con inversiones previstas de Nvidia y Microsoft de hasta 15.000 millones de dólares. El acceso no es abierto. Cada organización debe cumplir los requisitos de seguridad de Anthropic antes de usar el modelo, y la compañía afirma que ampliará el alcance geográfico más adelante.
Para 𝕏 @AnthropicAI (Anthropic), Glasswing es un esfuerzo colaborativo para proteger el software más importante del mundo, con un criterio común entre socios: que un ataque exitoso a su código tendría consecuencias catastróficas.
La validación práctica llega de 𝕏 @nuxt_js (Nuxt), que ha publicado las versiones 4.4.7 y 3.21.7 corrigiendo siete avisos de seguridad, incluidas todas las vulnerabilidades notificadas a través de Project Glasswing y otras halladas por investigadores externos.
Más información:
6. TinyFish abre Bigset para datasets en vivo
TinyFish ha publicado Bigset, un sistema multiagente de código abierto que transforma una instrucción en lenguaje natural en un conjunto de datos estructurado y verificado, extraído de la web en tiempo real. El usuario describe lo que necesita, el sistema infiere el esquema y despliega agentes que investigan páginas reales, deduplican y devuelven una tabla exportable en CSV o XLSX.
El reparto del trabajo define la arquitectura: un agente orquestador hace descubrimiento en anchura, decide qué filas entran y dónde buscarlas, y reparte sub-agentes que rellenan cada entidad. El orquestador no tiene permiso de escritura propio. Cada sub-agente trabaja con un presupuesto ajustado de seis llamadas a herramientas, recopila datos mediante TinyFish Search y Fetch, e inserta una fila con sus URLs de origen y el rastro de cómo la obtuvo. La instrucción a los agentes es explícita: no fabricar valores, dejar campos en blanco cuando no se pueden confirmar y rechazar claves duplicadas.
El objetivo está en sustituir scrapers manuales y pipelines de limpieza de datos por un flujo con trazabilidad de fuentes, un requisito habitual en usos empresariales.
Más información:
📎 TinyFish Bigset turns text prompts into live datasets
7. Zoox apuesta por la simulación para los casos límite
Zoox, la filial de coches autónomos de Amazon, ha publicado en su Journal un artículo divulgativo sobre cómo trata los 'edge cases': situaciones raras o impredecibles que surgen en la vía y el principal obstáculo para el despliegue masivo de la conducción autónoma. Su tesis es sencilla. Donde un conductor humano improvisa con experiencia y lógica, un sistema autónomo necesita otro método, y Zoox lo apoya en la simulación. El argumento es habitual en el sector: por definición, esos casos ocurren pocas veces, así que cuesta reunir datos reales suficientes para entrenar y validar.
La clave es Scenario Diffusion, una técnica de IA generativa desarrollada por Zoox que permite crear escenarios de tráfico realistas y controlados a gran escala. En lugar de esperar a que aparezca una situación difícil durante pruebas reales, los equipos pueden provocarla en simulación, modificarla y repetirla para comprobar cómo responde el software del robotaxi. Si Zoox logra validar más rápido cada actualización de software, puede reducir costes de prueba, acelerar despliegues urbanos y reforzar su posición frente a competidores como Waymo y Tesla. El movimiento llega en plena expansión: Reuters informó en marzo de que Zoox ampliaría su servicio en San Francisco y Las Vegas, y comenzaría pruebas con sus robotaxis en Austin y Miami.
El planteamiento de 𝕏 @zoox (Zoox) separa la intuición humana del método de máquina: los conductores improvisan ante lo inesperado, mientras que un sistema autónomo necesita simular esos escenarios antes de encontrárselos en la vía.
Más información:
📎 Engineering for the unlikely



