Anthropic recupera Fable 5 tras retirarse controles de exportación

Regresa con nuevos filtros de seguridad que pueden limitar tareas rutinarias de programación.

jul 01, 2026

Si sigues 1 Minuto de IA, ya lo sabes: en 2026 la IA ha dado un salto con la llegada de los agentes. El reto ya no está en mejorar la productividad individual, sino en transformar cómo trabaja toda la organización.

Y por eso quiero hablarte del Máster Ejecutivo en IA del Instituto de Inteligencia Artificial. Un programa para entender la IA de verdad y cambiar tu futuro profesional, por el que ya han pasado más de 1.000 alumnos.

Inscríbete antes de este viernes 3 de julio para aprovechar el descuento especial de early-bird. Además, por ser lector puedes utilizar el cupón 1MINUTODEIA300 para obtener 300€ de descuento adicionales.

👉 Reserva tu plaza o descarga el programa

¿Qué pasó ayer? En un minuto:

Anthropic vuelve a desplegar Claude Fable 5 a nivel global después de que Comercio retirase los controles de exportación que lo bloquearon durante casi tres semanas.
Anthropic lanza Claude Sonnet 5, su modelo intermedio ahora más orientado a la autonomía: planifica tareas, usa navegadores y terminales y revisa su propio trabajo. Promete rendimiento cercano a Opus 4.8 a un precio menor.
Google DeepMind saca dos modelos generativos con la vista puesta en el precio: Nano Banana 2 Lite, su modelo de imagen más rápido y barato, y Gemini Omni Flash para edición de vídeo. Google se centra en el coste por generación, no en la calidad bruta.
Etched irrumpe en el mercado con su primer chip funcional para inferencia, 800 millones levantados y más de 1.000 millones en contratos ya firmados.
Un estudio sobre 21.559 empresas estadounidenses concluye que las que más invierten en IA elevan plantilla en torno a un 10%, no la recortan.
Figure despliega su humanoide F.03 en la planta de BMW en Spartanburg, en tareas logísticas de preparación ordenada de componentes para el montaje final.
Bridgewater ha ajustado un modelo con Tinker para filtrar qué noticias financieras merecen atención de sus analistas. La empresa afirma que rinde más y cuesta menos que un modelo frontera.
OpenAI lanza GeneBench-Pro, un benchmark que mide si los agentes saben moverse en datos biológicos desordenados y tomar decisiones con criterio.

Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.

Y si tienes más de un minuto…

1. Anthropic recupera Fable 5 tras levantar controles de exportación

Anthropic ha anunciado que Claude Fable 5, su modelo público más potente, vuelve a estar disponible en todo el mundo tras la retirada de los controles de exportación que el Departamento de Comercio de EE. UU. había impuesto sobre él y sobre Claude Mythos 5. La restricción llegó el 12 de junio: el gobierno aplicó controles que obligaban a limitar el acceso a ciudadanos extranjeros dentro y fuera del país.

Como la orden tuvo efecto inmediato y la empresa no podía verificar la nacionalidad en tiempo real, optó por suspender ambos modelos para todos los usuarios. Los controles se levantaron el 30 de junio, tras varias conversaciones con la administración. Mythos 5, más sensible por su uso en ciberseguridad defensiva, seguirá limitado a organizaciones estadounidenses seleccionadas mientras Anthropic negocia una ampliación controlada.

El episodio nació de una alerta de seguridad: investigadores de Amazon detectaron una forma de saltarse parte de las barreras de Fable 5 para obtener información sensible sobre vulnerabilidades de software. Anthropic sostiene que el caso no reveló capacidades únicas de Mythos 5 y afirma haber reforzado sus filtros, que ahora bloquean la técnica reportada en más del 99% de los casos. También admite que, a corto plazo, algunos usos rutinarios de programación podrían verse afectados por la activación de esos filtros.

El episodio muestra hasta qué punto la política de exportación condiciona la disponibilidad de modelos frontera, sobre todo los que destacan en programación y ciberseguridad. Los modelos de IA más avanzados empiezan a comportarse como infraestructura regulada. Y aunque finalmente el gobierno de EE.UU.. haya levantado la suspensión, sienta un precedente que tendrá importantes repercusiones geopolíticas aún por determinar.

Para 𝕏 @levie (Aaron Levie), este caso funciona como el primer precedente de cómo se gestionarán los lanzamientos de modelos frontera con capacidades serias de programación y ciberseguridad, y adelanta que GPT-5.6 pasará probablemente por un proceso parecido.

𝕏 @emollick (Ethan Mollick), que tuvo acceso anticipado, valora mucho el modelo pero reconoce que la retirada le retrasó varios proyectos y que activó los mecanismos de seguridad con demasiada frecuencia por motivos poco evidentes; ahora espera ver cómo se comportan los nuevos filtros.

𝕏 @tunguz (Bojan Tunguz) rebaja el optimismo al constatar que los nuevos clasificadores dejan a Fable poco útil para programar a corto plazo, después de haberse alegrado por la reincorporación.

𝕏 @WesRoth (Wes Roth) apunta un detalle operativo extraído de las cadenas de la app: el acceso a Fable 5 podría exigir verificación de identidad y facturarse mediante un sistema de créditos separado del plan del usuario.

𝕏 @testingcatalog (Ai News | Testingcatalog) subraya el matiz de facturación: el uso gratuito dentro del límite semanal es temporal y expira el 7 de julio, cuando Fable 5 pasa a depender de créditos de pago.

Más información:
📎 Redeploying Claude Fable 5

2. Anthropic lanza Claude Sonnet 5 para agentes

Anthropic ha lanzado Claude Sonnet 5, su modelo intermedio más orientado a la autonomía. Lo presenta como capaz de planificar tareas de varios pasos, usar herramientas como navegadores y terminales, revisar su propio trabajo y completar trabajos complejos que las versiones anteriores dejaban a medias. El posicionamiento es claro: rendimiento cercano al de Opus 4.8, pero a menor coste. En SWE Bench Pro, un benchmark de resolución de problemas de programación, Sonnet 5 puntúa 63,2%, frente al 58,1% de Sonnet 4.6. El precio promocional reportado ronda los 2 dólares por millón de tokens de entrada y 10 por millón de salida, con ventana de contexto opcional de 1 millón de tokens y corte de conocimiento en enero de 2026.

El lanzamiento coincide con una fase de fuerte expansión para la compañía: se han mencionado inversiones de Nvidia y Microsoft por hasta 15.000 millones de dólares, un compromiso de 30.000 millones en cómputo de Azure y una solicitud confidencial de salida a bolsa. El foco del sector se ha desplazado de la conversación a la ejecución de flujos completos, donde el coste por tarea y la fiabilidad pesan tanto como la calidad bruta. El despliegue es inmediato para todos los usuarios en Claude y en la API, y el modelo está disponible en AWS a través de la plataforma nativa de Claude. Las puntuaciones independientes de Agent Arena aún no se han publicado.

El salto en SWE Bench Pro es el argumento que más subraya 𝕏 @testingcatalog (Ai News | Testingcatalog), que sitúa a Sonnet 5 muy cerca de Opus 4.8 pero a un coste sensiblemente menor, el ángulo comercial más obvio del lanzamiento.

𝕏 @levie (Aaron Levie) aporta la validación desde el lado cliente: Box ha pasado el modelo por su propio benchmark de trabajo documental empresarial y sostiene que mantiene calidad de primer nivel en tareas de varios pasos, superando a Sonnet 4.6 en varios apartados.

Para 𝕏 @WesRoth (Wes Roth), lo relevante es la capacidad de retomar trabajos complejos que los Sonnet anteriores dejaban sin terminar, aunque advierte que Anthropic promete mejoras sin acompañarlas de cifras concretas en el propio anuncio.

𝕏 @arena (Arena.Ai) enmarca el modelo dentro de su terreno de pruebas, evaluándolo en millones de tareas reales de largo alcance con acceso a búsqueda web, sistema de archivos y terminal, y lo posiciona como alternativa más barata frente a Opus, GPT-5.5 y Gemini Pro.

Más información:
📎 Introducing Claude Sonnet 5

3. Google lanza Nano Banana 2 Lite y Omni Flash

Google DeepMind ha presentado dos modelos de generación multimedia en la familia Gemini. Nano Banana 2 Lite, identificado como Gemini 3.1 Flash-Lite Image, genera imágenes en menos de cuatro segundos a 0,034 dólares por cada mil. Gemini Omni Flash se centra en la generación y edición conversacional de vídeo, a 0,10 dólares por segundo, la misma tarifa que Veo 3.1 Fast. El interés aquí es comercial más que técnico: Google compite en precio en un segmento donde el coste por generación decide la adopción. Ambos están disponibles en Google AI Studio, la Gemini API y la Gemini Enterprise Agent Platform. Nano Banana 2 Lite llega en despliegue general; Omni Flash, en preview público.

La Interactions API permite encadenar los dos modelos: generar una imagen con el primero y animarla con el segundo, con historial de sesión para apilar hasta tres ediciones seguidas. Nano Banana 2 Lite también aparece en el modo IA de las búsquedas y la app de Gemini. Las imágenes generadas incorporan la marca de agua invisible SynthID para señalar su origen. En la Text-to-Image Arena, el modelo de imagen entra quinto con 1.251 puntos; en Text-to-Video, Omni Flash ocupa el segundo puesto sobre datos aún preliminares.

Para 𝕏 @digg (Digg), el anuncio es ante todo una jugada de precio: los 4 segundos por imagen a 0,034 dólares por millar y el vídeo editable a 0,10 dólares por segundo pesan más que cualquier mejora de calidad bruta.

𝕏 @OfficialLoganK (Logan Kilpatrick) apuesta por que la velocidad de Nano Banana 2 Lite abrirá casos de uso sensibles a la latencia, y espera que Omni haga con el vídeo lo que Nano Banana hizo con la imagen.

𝕏 @arena (Arena.Ai) sitúa a Nano Banana 2 Lite en la frontera de Pareto: calidad cercana a la de un buque insignia por una fracción del coste, quinto puesto en Text-to-Image y casi 40 puntos por delante del siguiente en edición de vídeo.

𝕏 @mark_k (Mark Kretschmann) había anticipado las dudas sobre su naturaleza: si sería un sucesor de Nano Banana 2 o una variante más ligera basada en Gemini Flash Lite, hipótesis que el lanzamiento acabó confirmando.

𝕏 @WesRoth (Wes Roth) enmarca el modelo como herramienta de experimentación rápida y alto volumen, con resultados de texto a imagen en torno a cuatro segundos.

Más información:
📎 Start building with Nano Banana 2 Lite and Gemini Omni Flash

4. Etched aparece en escena para competir con Nvidia

La empresa Etched ha salido de la cueva con el anuncio de su primer chip funcional y un sistema de inferencia a escala de rack. La compañía afirma haber completado un tapeout A0 satisfactorio y levantado 800 millones de dólares, con más de 1.000 millones en contratos de clientes ya firmados. Su valoración se sitúa en 5.000 millones. La propuesta apunta a Nvidia en la inferencia, la fase de ejecución de modelos ya entrenados. El diseño cubre prefill y decode, las dos etapas de la inferencia de los grandes modelos de lenguaje basados en la arquitectura Transformer.

El interés por la inferencia responde a un cálculo de negocio: cuando el uso de modelos se generaliza, el coste por consulta pesa tanto como la calidad bruta, y ahí un hardware especializado puede competir con la infraestructura dominante. La arquitectura de Etched apuesta por una interconexión intensiva de su memoria. El ancho de banda de la memoria es un cuello de botella conocido en las cargas de inferencia a escala de rack. No se han publicado benchmarks de rendimiento independientes ni fechas de disponibilidad general de los sistemas.

El detalle técnico que subraya 𝕏 @SemiAnalysis_ (Semianalysis) es la cantidad de enlaces SerDes en la memoria a escala de clúster de Etched, señal de que el eje del diseño es la interconexión y no solo el cómputo.

𝕏 @gabriel1 (Gabriel) lleva la lectura al terreno de la tesis de mercado: sostiene que la inferencia será el mayor mercado del mundo y que la demanda de inteligencia es prácticamente ilimitada, una afirmación aspiracional sin cifras que la respalden.

Más información:
📎 Etched: Frontier Inference Clusters

5. Un estudio vincula la adopción de IA con más empleo

La idea de que la inteligencia artificial está provocando una ola inmediata de despidos empieza a mostrar más matices. Un nuevo análisis de Ramp y Revelio Labs, basado en datos de casi 22.000 empresas estadounidenses entre 2021 y 2026, concluye que las compañías que invierten con más intensidad en IA aumentaron su plantilla un 10,2% en los dos años posteriores a su adopción. En los puestos de entrada, el crecimiento fue incluso mayor: un 12%. El trabajo cruza datos de gasto por empresa con series de empleo, un enfoque más granular que las encuestas al uso.

El hallazgo alimenta un debate ya abierto: análisis del Budget Lab de Yale, con Brookings, sostienen que la IA generativa no ha provocado disrupciones laborales relevantes desde ChatGPT, y el BCE apunta en la misma línea, ligando la IA a mejoras de productividad sin destrucción neta de puestos. El informe también advierte que los efectos tardan entre seis y doce meses en aparecer, porque las organizaciones necesitan aprender a trabajar con estas herramientas.

También es necesario leer los resultados con cautela. La correlación no implica causalidad: las empresas que más invierten en IA suelen ser grandes, jóvenes y dinámicas, factores que por sí solos explican tanto la contratación como el gasto tecnológico. El propio estudio se apoya en gasto declarado como indicador de adopción, no en medición directa del uso, y no aísla los despidos por función frente al crecimiento neto agregado.

El estudio funciona para 𝕏 @DavidSacks (David Sacks) como una 'violación de la narrativa' dominante: muestra que las firmas que más invierten en IA aumentan empleo en lugar de recortarlo.

Aporta datos propios 𝕏 @levie (Aaron Levie): una encuesta de Box a más de 1.600 empresas medianas y grandes coincide con lo observado por Ramp, más adopción de IA junto a mayor crecimiento de plantilla, aunque su papel como proveedor del sector invita a leerlo con distancia.

Carga contra el sensacionalismo previo 𝕏 @Dan_Jeffries1 (Daniel Jeffries): sostiene que predicciones extremas, como la desaparición del 50% del trabajo de oficina, dominaron los titulares porque el miedo vende, mientras las estimaciones prudentes pasaban desapercibidas.

Advierte 𝕏 @c_valenzuelab (Cristóbal Valenzuela) que la evidencia puede pesar poco frente a la percepción: las narrativas virales sobre empleo, consumo de agua o muerte de la creatividad se propagan por su carga emocional más que por su veracidad.

Más información:
📎 A New Look at AI’s Impact on Jobs

6. Figure lleva su humanoide 03 a BMW

Figure AI ha llevado su nuevo robot humanoide Figure 03 a la planta de BMW Group en Spartanburg, Carolina del Sur, en un nuevo paso para automatizar tareas industriales que hasta ahora eran difíciles de resolver con robots tradicionales. La prueba se realiza en el Hall 52, una zona dedicada a ensamblaje y logística, y llega tras el despliegue de Figure 02 en 2025, que contribuyó a la producción de 30.000 vehículos BMW X3.

La novedad no está solo en el robot, sino en el tipo de trabajo. Figure 03 ya no se limita a cargar piezas de chapa en una línea: ahora aborda tareas de “secuenciación”, es decir, seleccionar y colocar componentes en el orden correcto para alimentar la producción. En la práctica, esto exige adaptarse a piezas que no siempre llegan en la misma posición, moverlas con precisión y, al mismo tiempo, arrastrar carros pesados por la línea.

Figure atribuye ese salto a Helix 02, su modelo propietario de píxeles a acciones, que coordina manos, brazos, torso y pies para manipular piezas finas mientras el robot se reposiciona y arrastra un carro metálico pesado sobre ruedas. BMW consigue más flexibilidad en fábrica, automatización de tareas físicamente exigentes y una posible reducción de cuellos de botella en logística interna. No obstante, la compañía ya había señalado que estas pruebas sirven para evaluar qué aplicaciones industriales pueden escalarse de forma segura antes de una adopción más amplia

El punto diferencial para 𝕏 @Figure_robot (Figure) es la manipulación dinámica de material que, según la empresa, resulta inviable con automatización fija o brazos de seis ejes, y que justifica la forma humanoide en las tareas de secuenciación.

La noticia es una ampliación de la relación con BMW para 𝕏 @xmaquina (Xmaquina): tras once meses de Figure 02 en producción, Figure 03 asume ahora la preparación ordenada de componentes para el ensamblaje final.

El historial operativo funciona como aval a ojos de 𝕏 @roboticomarket (Robotico): los once meses de Figure 02 en el body shop, ligados a más de 30.000 X3, dan base real al despliegue en logística.

En clave de sustitución de empleo en fábrica lo enmarca 𝕏 @LockedIn_News (Lockedin), un titular más alarmista de lo que confirman los propios datos de Figure sobre alcance y unidades.

Más información:
📎 F.03 Arrives at BMW

7. Bridgewater afina un modelo con Tinker

Thinking Machines Lab, el laboratorio de IA de Mira Murati, ha publicado un caso de uso de Tinker, su plataforma de ajuste fino de modelos. El cliente es Bridgewater, uno de los mayores fondos de cobertura del mundo. El trabajo parte de un problema cotidiano en firmas de inversión: equipos inundados por noticias, informes, documentos corporativos, emails y análisis internos. La dificultad no está en acceder a la información, sino en separar la señal del ruido. Según el estudio, los modelos líderes probados (incluidas variantes de Gemini, Claude y GPT) rondaban inicialmente una precisión cercana al 50% en seis tareas financieras simples. Con mejores instrucciones, subieron hasta el entorno del 75%, pero seguían por debajo del umbral del 80% que los inversores consideraban necesario para confiar en el sistema en su flujo de trabajo diario.

La mejora llegó al entrenar un modelo específico con datos etiquetados por expertos. El resultado: una precisión media del 84,7%, frente al 78,2% del mejor modelo generalista evaluado, y un coste por tarea 13,8 veces menor. La lectura en clave empresarial es que el valor de la IA en sectores intensivos en conocimiento puede depender menos de usar el modelo más potente del mercado y más de entrenar sistemas con el criterio propio de cada organización. Thinking Machines posiciona Tinker, su API para ajustar modelos abiertos sin gestionar infraestructura de GPU, como una pieza clave para facilitar esa personalización.

El marco que defiende 𝕏 @miramurati (Mira Murati) es el de una IA que refuerza al experto en lugar de sustituirlo: Bridgewater aporta el conocimiento financiero, el laboratorio la capacidad técnica y el analista se concentra en lo relevante.

El ángulo económico es el argumento principal para 𝕏 @soumithchintala (Soumith Chintala): el modelo ajustado sobre Tinker sería más efectivo y más barato que cualquier modelo frontera, aunque lo plantea sin cifras que permitan contrastarlo.

La lógica de producto que apunta 𝕏 @eisokant (Eiso Kant) está en la velocidad de iteración con 'The Model Factory', pensada para reducir la fricción entre idea y resultado y acortar el ciclo de experimentación de los investigadores.

Más información:
📎 Learning to Replicate Expert Judgment in Financial Tasks

8. OpenAI presenta GeneBench-Pro para biología computacional

OpenAI ha presentado GeneBench-Pro, una nueva prueba diseñada para medir si los agentes de inteligencia artificial pueden enfrentarse a análisis complejos en biología computacional, un área clave para farmacéuticas, biotecnológicas y compañías de salud. A diferencia de los test tradicionales, no evalúa solo si un modelo sabe ejecutar una tarea, sino si puede tomar buenas decisiones cuando los datos son incompletos, ambiguos o difíciles de interpretar.

El benchmark incluye 129 problemas en campos como genómica, diagnóstico clínico, cáncer, farmacogenómica y medicina traslacional. OpenAI asegura que cada ejercicio ha sido construido para saber con precisión cuál es la respuesta correcta, evitando que los modelos “acierten” por atajos o por decisiones arbitrarias del evaluador. El mejor modelo probado por OpenAI, GPT-5.6 Sol, alcanza una tasa de acierto del 31,5% en modo Pro, lo que muestra avances rápidos. Aún así, la propia compañía admite que los agentes actuales siguen siendo demasiado poco fiables para sustituir a expertos humanos.

Este benchmark encaja con un interés creciente por llevar los agentes a dominios científicos aplicados, donde el valor está en el proceso analítico y no solo en el resultado. La biología es un terreno exigente: cerca del 90% de los fármacos fracasa en ensayos clínicos, y afinar la fase de análisis podría tener consecuencias directas en la investigación.

El énfasis de 𝕏 @OpenAI (Openai) está en medir un tipo de progreso más exigente que las tareas cerradas: la capacidad de los agentes para elegir la ruta de análisis correcta cuando los datos biológicos llegan desordenados.

𝕏 @WesRoth (Wes Roth) lee GeneBench-Pro como un giro hacia agentes autónomos capaces de razonar en escenarios ambiguos, precisamente porque descarta el conocimiento factual y los flujos predefinidos para centrarse en detectar problemas en datos ruidosos.

Más información:
📎 Introducing GeneBench-Pro

Discusión sobre este post

Por supuesto, sigue adelante.