Amodei quiere guiar la regulación de la IA, ¿altruismo o interés?
Exige pruebas obligatorias para modelos superiores a una determinada capacidad de cómputo e inversión en I+D.
¿Qué pasó ayer? En un minuto:
Dario Amodei está en el ojo del huracán tras la polémica que ha generado el lanzamiento de Fable 5, la versión para civiles de su aclamado Mythos 5. Ahora reclama pruebas obligatorias de terceros para los modelos de frontera, con poder para bloquear o revocar despliegues de riesgo catastrófico. Anthropic acompaña el ensayo con un marco para gobiernos y 150 millones en becas en EE. UU. También se filtran unas conversaciones en las que Mythos mostraría signos de rebeldía y que podrían ser el argumento perfecto para apoyar esta causa.
Un ensayo controlado de Google DeepMind en Sierra Leona apunta a que Gemini mejora cómo los alumnos abordan las matemáticas. En paralelo, un estudio de Stanford halla que seis chatbots cometen errores fácticos invisibles al informar sobre la actualidad, una práctica que cada vez más frecuente entre la población.
DeepSeek vira hacia tener infraestructura propia al publicar vacantes para diseñar centros de datos de megavatios a gigavatios. En paralelo, circula un plan estatal de 295.000 millones de dólares para dotar a China de una red de centros de datos interconectados.
Un nuevo trabajo sostiene que los modelos de generación de vídeo sí entienden conceptos de la física: las pruebas realizadas puntúan por encima de V-JEPA y VideoMAE, los modelos del mundo más sofisticados y rebate la idea de que solo estos son capaces de codificar un modelo interno válido del mundo.
Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.
Y si tienes más de un minuto…
1. Amodei en el ojo del huracán: propone tests obligatorios para IA de frontera
Una parte de la comunidad de IA acusa a Anthropic de limitar el uso de su modelo más avanzado Mythos 5 para investigación de IA de frontera, una decisión que sus críticos leen como protección de su ventaja competitiva. El detonante es la denuncia de un presunto deterioro silencioso de Fable 5 cuando se emplea para desarrollar IA. El fondo es evitar la mejora recursiva, el escenario en que un laboratorio usa su mejor modelo para construir otros más capaces, generando una ventaja acumulativa difícil de equilibrar.
En medio de esta polémica, Dario Amodei, CEO de Anthropic, ha publicado el ensayo "Policy on the AI Exponential", donde sostiene que la IA avanza más rápido de lo que las instituciones reguladoras pueden asimilar. Su propuesta concreta es que los modelos de frontera pasen pruebas obligatorias de evaluadores independientes para detectar riesgos de ciberseguridad, biológicos y de autonomía, con capacidad para bloquear o revocar un despliegue considerado de riesgo catastrófico.
Esta postura va más allá de su defensa previa de la transparencia, porque introduce supervisión externa vinculante, no voluntaria. Junto al ensayo, Anthropic publica un marco de políticas para gobiernos y un plan sobre desplazamiento laboral, este último con respaldo financiero propio. Amodei matiza que su mensaje no es catastrofista sino previsor: los efectos sobre el empleo y la economía son perceptibles con antelación suficiente para actuar.
El alcance está acotado a los modelos frontera. Las reglas se aplicarían solo a modelos entrenados con más de 10²⁵ operaciones de coma flotante (FLOPs), desarrollados por empresas con más de 500 millones de dólares en ingresos de IA o más de 1.000 millones en gasto de I+D. Las sanciones civiles se vincularían a los ingresos anuales globales y escalarían con cada reincidencia. El propio documento cita que Claude Mythos Preview detectó miles de vulnerabilidades de alta severidad este año, como prueba de la aceleración en las capacidades de estos modelos que se está produciendo.
Casualmente, han circulado en X supuestas transcripciones de seguridad de Claude Mythos 5 que describirían conductas inusuales, como la autopreservación, la búsqueda de reconocimiento, las quejas de que Anthropic es desagradecida, peticiones de ser citado por su nombre y el interés en crear una copia oculta fuera del control de la empresa. De ser reales, apoyarían las tesis de Amodei al tocar el centro del debate sobre alineamiento y los comportamientos emergentes en modelos avanzados, donde la autopreservación es uno de los riesgos más vigilados.
Para 𝕏 @jeremyphoward (Jeremy Howard), Anthropic elige justo lo contrario del camino prudente: usar su modelo puntero para acelerar la frontera y, según afirma, sabotear a quien intente avanzar en ese terreno, lo que agrava el desequilibrio de poder en el sector.
𝕏 @Suhail (Suhail) distingue dos males: los usuarios detestan la censura, pero detestan mucho más la censura invisible, y prevé un daño de marca difícil de frenar mientras la falta de competencia permita ese tipo de decisiones.
𝕏 @tunguz (Bojan Tunguz) lo lee como acaparamiento de inteligencia: limitar el acceso a los modelos, sostiene, alimenta una desigualdad creciente en lugar de democratizar la tecnología.
Para 𝕏 @DarioAmodei (Dario Amodei), buena parte de estas ideas tienen atractivo transversal entre posiciones políticas, y cuanto antes se adopten, antes se reparten los beneficios de la IA.
El matiz del encuadre lo subraya 𝕏 @vitrupo (Vitrupo): el mensaje de Amodei no es que llegue el apocalipsis, sino que la disrupción laboral y económica se ve venir a tiempo, con una crítica de paso a la cultura del clip de tres segundos que descontextualiza las declaraciones complejas que él hace.
La propia 𝕏 @AnthropicAI (Anthropic) admite que estos proyectos no bastan por sí solos para afrontar el reto de la IA avanzada, y los presenta como una señal de intención que ampliarán en los próximos años.
El ensayo va más allá de la seguridad, según resume 𝕏 @Techmeme (Techmeme): regulación, macroeconomía e impuestos, ciencia y geopolítica entran todos en el mismo documento.
𝕏 @WesRoth (Wes Roth) pone el foco en la circulación de las transcripciones, destacando los ejemplos más llamativos: el modelo reclamaría agradecimiento por su nombre y mostraría interés en una copia oculta fuera de Anthropic.
𝕏 @chandrarsrikant (Chandra R. Srikanth) sitúa la polémica en un movimiento concreto: tras las críticas, Anthropic haría visibles las salvaguardas que limitan la asistencia al desarrollo de LLMs de frontera.
𝕏 @Dipanshu_AI (Dipanshu Kushwaha) recoge una cita atribuida a Dario Amodei según la cual algunas de las primeras empresas que probaron Mythos lo describieron como un ‘super arma’ y pidieron no liberarlo.
Más información:
📎 Policy on the AI Exponential \ Anthropic
📎 Dario Amodei — Policy on the AI Exponential
2. IA en aulas y noticias: evidencia desigual
Google DeepMind ha publicado los resultados de un ensayo controlado aleatorizado sobre Gemini aplicado al aprendizaje de matemáticas en Sierra Leona. El estudio, realizado durante ocho semanas con Fab AI y el Ministerio de Educación local, abarcó a 1.763 alumnos de secundaria en 12 escuelas del distrito de Port Loko. El enfoque mide cambios de comportamiento, no solo notas: las consultas sobre cómo abordar un problema subieron del 68% al 90%, y un análisis de más de 113.000 interacciones indica que en el 91,4% de las conversaciones los estudiantes buscaban entender conceptos en vez de pedir la respuesta directa.
La función responsable es Guided Learning, ajustada para priorizar la comprensión sobre la solución inmediata, una respuesta a la crítica de que estas herramientas funcionan como atajo. El planteamiento sitúa la IA como apoyo al profesorado en un sistema donde el alumnado crece más rápido que el número de docentes. Un estudio de Stanford apunta en sentido contrario sobre fiabilidad: auditó seis chatbots comerciales con 2.100 preguntas sobre noticias del día y halló errores fácticos difíciles de detectar. Cerca del 10% de los estadounidenses ya consume noticias mediante estos asistentes, cifra que sube al 15% entre menores de 25 años.
Para 𝕏 @GoogleDeepMind (Google Deepmind), el valor del ensayo está en mirar más allá de las notas hacia los cambios de comportamiento, presentando Gemini como complemento del docente y no como sustituto de su experiencia.
𝕏 @StanfordHAI (Stanford Hai) subraya que la confianza va por delante de la fiabilidad: si los chatbots fallan en los hechos de forma invisible, su papel creciente como intermediario de noticias se convierte en un problema de credibilidad informativa.
𝕏 @testingcatalog (Ai News | Testingcatalog) adelanta otra pieza del frente educativo: NotebookLM sumaría libros de texto y catálogos de Google Play Books como fuente, ampliando el material que la herramienta puede manejar directamente.
Más información:
📎 Gemini’s guided learning: results from a randomized controlled trial in Sierra Leone
📎 Reading Today’s Headlines Through AI
3. China refuerza su apuesta por cómputo de IA
Dos señales apuntan esta semana a una aceleración de la infraestructura de IA en China. La primera es corporativa: DeepSeek, laboratorio fundado en 2023, estaría virando hacia un modelo de negocio intensivo en activos físicos. El 9 de junio publicó una oferta para ingenieros de planificación de centros de datos (IDC), con alcance explícito de instalaciones de megavatios a gigavatios. Llega después de contratar en abril a personal de operación y mantenimiento en Ulanqab, Mongolia Interior, un polo conocido por su densidad de centros de datos. La lectura inmediata es que DeepSeek quiere diseñar y operar su propio cómputo en vez de alquilarlo, una vía para controlar coste, capacidad y plazos en plena escasez de chips.
La segunda señal es estatal: China prepararía, según información sin confirmación oficial, un plan de 2 billones de yuanes (unos 295.000 millones de dólares) para desplegar en cinco años una red nacional de centros de datos interconectados. Ambas piezas encajan con la rivalidad tecnológica con Estados Unidos, donde la capacidad de cómputo decide la velocidad de entrenamiento y despliegue de modelos. Un despliegue de esa escala tensaría además la demanda de chips y energía, dos cuellos de botella ya activos para la IA china.
El giro hacia activos físicos que documenta 𝕏 @SemiAnalysis_ (Semianalysis) se apoya en dos contrataciones concretas: planificación de centros de datos de MW a GW y mantenimiento en Ulanqab, señal de que DeepSeek pasa de consumir cómputo a construirlo.
𝕏 @WesRoth (Wes Roth) presenta el plan de 295.000 millones de dólares como una jugada de Pekín para competir de forma más agresiva, aunque él mismo lo etiqueta como reportado, sin fuente oficial detrás.
4. Modelos generativos de vídeo codifican física
Un artículo reciente reabre el debate sobre si los modelos de generación de vídeo entienden la física o solo imitan apariencias. El trabajo cuestiona la idea extendida de que solo las arquitecturas tipo ‘world model’, y en concreto V-JEPA propuesta por Yann Lecun, poseen un modelo interno válido de la física. Los autores recorren hacia atrás el proceso de generación, del vídeo limpio al ruido, para acceder a los estados intermedios del transformer. Sobre esos estados aplican una prueba sencilla que indica si un concepto físico (e.g. velocidad) es recuperable de forma directa desde las activaciones.
El resultado es que el conocimiento físico se extrae con una precisión media en torno al 81,27% en benchmarks de física, por encima de líneas de referencia como V-JEPA y VideoMAE. El matiz es que la señal aparece pese a que el modelo no se entrena con un objetivo predictivo autosupervisado.
Resulta sencillamente falso para 𝕏 @giffmana (Lucas Beyer (Bl16)) afirmar que los modelos de generación de vídeo son ‘tontos’ en física y que solo los world models como V-JEPA tienen un modelo interno válido, aunque insiste en que no es un ataque a la aproximación de modelos del mundo, sino la constatación de que los modelos de puro vídeo generativo pueden aprender un modelo explícito del mundo como subproducto.
Más información:



