Un modelo de OpenAI refuta una conjetura matemática abierta desde 1946

El modelo de razonamiento general, no estaba entrenado específicamente para las matemáticas.

Miguel A. Román

may 21, 2026

¿Qué pasó ayer? En un minuto:

Un modelo de OpenAI habría refutado una conjetura matemática abierta desde 1946, un hito en la aplicación de la IA para innovación científica.
Se revela un contrato de SpaceX con Anthropic de 1.250 millones al mes hasta mayo de 2029 por capacidad de cómputo, con una cláusula de salida a 90 días.
Jeff Bezos rechaza la tesis de que la IA destruirá empleo y defiende que elevará a los trabajadores, el mensaje choca con señales de hartazgo social.
El debate sobre regulación de la IA salta del modelo a la capa física: registros de chips, inspecciones a clústeres y vigilancia financiera.
Kling desembarca en Cannes con RAPHAEL, largometraje 100% generado por IA; House of David primera producción de Hollywood que reconoce uso de IA.
Google procesa 3,2 cuatrillones de tokens al mes, cifra que mide adopción real y anticipa el problema que más inquieta a los CIOs: el coste sin previsibilidad.
François Chollet describe dos fallos recurrentes en agentes de programación; la fiabilidad depende de los controles externos que el agente no pueda tocar.
Michael I. Jordan califica AGI de término de relaciones públicas y describe el debate sobre la AGI como desmoralizador para los investigadores jóvenes.

Y si tienes más de un minuto…

1. OpenAI dice haber refutado una conjetura de Erdős

OpenAI afirma haber logrado un avance en el problema de la distancia unidad en el plano, una pregunta abierta planteada por Paul Erdős en 1946. Según la compañía, un modelo interno de razonamiento de propósito general ha refutado la intuición sostenida durante casi 80 años de que las mejores configuraciones se parecen a rejillas cuadradas, proponiendo una construcción distinta. El detalle relevante es que, según OpenAI, no se trata de un sistema afinado para matemáticas ni de un andamiaje sobre un demostrador formal, sino de un LLM generalista. Los hitos previos en demostración automática venían de provers simbólicos o de modelos especializados como AlphaProof de Google DeepMind, así que la afirmación, de confirmarse, alteraría el reparto de capacidades entre sistemas verticales y generales.

Además, una versión revisada y explicada por matemáticos externos ya está publicada como una prueba validada por humanos del descubrimiento. La IA empieza a mostrar capacidad para participar en el proceso de innovación científica. Si estos sistemas pueden sostener razonamientos complejos y encontrar conexiones inesperadas, su impacto potencial se extiende a otros campos científicos como la ciencia de los materiales o la biomedicina.

𝕏 @sama (Sam Altman) reconoce tener sentimientos encontrados sobre el hito y anticipa que este tipo de resultados se repetirá en los próximos años, una mezcla de entusiasmo e inquietud poco habitual en sus comunicaciones de producto.

𝕏 @polynoamial (Noam Brown) insiste en que el modelo no es un andamiaje ni está afinado para matemáticas, y subraya que no lo han llevado al límite en problemas abiertos, un matiz que apunta a margen de mejora más que a un techo.

Para 𝕏 @WesRoth (Wes Roth), OpenAI ha cruzado el umbral hacia el descubrimiento científico original, una lectura maximalista que conviene contrastar con la ausencia de revisión por pares.

𝕏 @emollick (Ethan Mollick) recuerda que las matemáticas son terreno cómodo para la IA porque tienen salidas verificables, y reta a los laboratorios a aplicar el mismo esfuerzo a sociología, economía o psicología, donde el impacto humano sería mayor.

Más información:
📎 An OpenAI model has disproved a central conjecture in discrete geometry

2. Anthropic pagará 45.000M a SpaceX por cómputo

El folleto de salida a bolsa que SpaceX ha presentado ante la SEC incluye un detalle que pocos esperaban: un acuerdo de servicios en la nube firmado con Anthropic en mayo de 2026, por el que el laboratorio pagará 1.250 millones de dólares mensuales por capacidad en los clústeres Colossus y Colossus II hasta mayo de 2029. La cifra equivale a 15.000 millones anuales y a un valor total cercano a 45.000 millones, con una cláusula que permite a cualquiera de las partes salir con 90 días de preaviso.

La operación coloca a SpaceX, hasta ahora asociada a cohetes y satélites, como proveedor de cómputo a gran escala, justo cuando necesita enseñar ingresos recurrentes al mercado público. Confirma que Anthropic, ya cliente de Amazon y Google, sigue repartiendo riesgo entre proveedores, con capacidad GB200 de Nvidia en Colossus II prevista para junio. Y refuerza la idea de que el cuello de botella competitivo en IA cada vez está menos en el modelo o en el talento, y más en el acceso garantizado a GPUs. Falta saber cómo encaja xAI en todo esto y si el preaviso de 90 días apunta a prudencia contable o a una relación menos firme de lo que sugiere el titular.

𝕏 @SemiAnalysis_ (Semianalysis) desglosa la letra pequeña del S-1 y traduce el contrato a métricas comparables: 15.000 millones anuales y 45.000 millones de TCV, una referencia que servirá para tasar el resto de acuerdos plurianuales del sector.

𝕏 @Chrisgpt (Chris) pone el foco en lo que más incomoda del acuerdo: las tarifas se aplican de forma escalonada en mayo y junio y cualquiera de las partes puede romperlo con 90 días de aviso, una flexibilidad que choca con la magnitud del compromiso anunciado.

Para 𝕏 @testingcatalog (Ai News | Testingcatalog) el detalle clave es operativo: Anthropic entraría en junio en racks GB200 dentro de Colossus II, señal de que asegurar Nvidia Blackwell pesa ya más que las decisiones de arquitectura.

𝕏 @OakenshieldVGX (Ȏ̶͖̽̌̾̈̄̍̀̆̆́͑͌͝Akenshield) hace el cálculo que muchos inversores en infraestructura repetirán esta semana: unos 50 millones de dólares por MW y año tomando Colossus I como referencia, una métrica difícil de igualar para los neoclouds cotizados.

3. Bezos rebate a los agoreros del empleo

Bezos ha rechazado en declaraciones a CNBC la idea de que la IA vaya a destruir empleo de forma masiva. Sostiene que la tecnología no sustituirá a los trabajadores, sino que ampliará su capacidad y productividad. El argumento llega tras meses de despidos en grandes tecnológicas justificados, en muchos casos, con referencias explícitas a la automatización. El contraste con la percepción social empieza a notarse. Los abucheos a Eric Schmidt en un discurso de graduación cada vez que mencionaba la IA, especialmente al afirmar que pasaría a formar parte de cómo se hace cualquier trabajo, apuntan a un desgaste del relato de progreso inevitable.

Dentro de la propia industria tampoco hay una sola voz: Shyam Sankar, CTO de Palantir, ha pedido dejar de tomar como referencia única a los creadores de los modelos, que tienen incentivos claros para sobrevender capacidades. La intervención de Bezos pesa por venir de quien dirige una de las compañías que más está reorganizando su plantilla alrededor de la IA. La coherencia de ese discurso dependerá de si convive con recortes en Amazon que apunten en sentido opuesto.

𝕏 @WesRoth (Wes Roth) interpreta los abucheos a Schmidt como prueba de que, fuera de la burbuja tecnológica, el entusiasmo automático por la IA se ha agotado, un contrapunto incómodo al mensaje tranquilizador de Bezos.

Más información:
📎 Bezos defends billionaires, hypes AI, talks taxes and praises Trump in CNBC interview

4. El debate sobre regular la IA se polariza

El discurso regulatorio sobre IA se está endureciendo en dos frentes. Uno propone trasladar al cómputo civil mecanismos del control de armamento: registros de chips, umbrales de memoria, vigilancia financiera de operadores, inspecciones sorpresa a clústeres y programas de denunciantes. La propuesta, defendida por partidarios de contener los modelos frontera, golpearía directamente a Nvidia, a los hyperscalers y a laboratorios como OpenAI, Anthropic o Google DeepMind, al exigir trazabilidad efectiva del hardware.

El segundo frente es ambiental. Las estimaciones disponibles apuntan a que en 2030 la IA podría consumir tanta electricidad como Japón, mientras el agua se mantendría por debajo del 1% del consumo estadounidense, con presión concentrada en el coste de servicios públicos próximos a la infraestructura. Ambos debates confluyen en un punto incómodo: la regulación deja de discutirse en términos de capacidades o limitaciones de la IA y pasa a tocar hardware, energía y agua, donde las empresas tienen menos margen para responder con mejoras de producto. Para inversores y operadores, lo relevante a corto plazo es si alguna jurisdicción occidental convierte estas ideas en norma vinculante mientras China consolida su ventaja en adopción, y cómo encajarían auditorías de clústeres en contratos plurianuales ya firmados con hyperscalers como AWS, Azure o Google Cloud.

Para 𝕏 @Dan_Jeffries1 (Daniel Jeffries), trasladar la lógica de los tratados de control de armas al cómputo civil, con inspecciones de desafío y delatores incluidos, no es gobernanza sino un régimen punitivo encubierto que castigaría al ecosistema de IA antes de que existan daños demostrados.

𝕏 @naval (Naval) ironiza con que el nuevo test de inteligencia consiste en entender la relación entre centros de datos y agua, y sostiene que el argumento hídrico es una excusa: el fondo del debate es que a una parte del público sencillamente no le gusta la IA.

𝕏 @emollick (Ethan Mollick) introduce el matiz incómodo para ambos bandos: el consumo individual es bajo, pero el agregado proyectado a 2030 equivale a la electricidad de un país entero.

5. La IA generativa entra en Cannes y Hollywood

La generación de vídeo con IA ha dado esta semana dos saltos en frentes distintos. En Cannes, Kling AI ha presentado RAPHAEL, un largometraje íntegramente generado por IA producido junto a Mateo AI Studio y al AI Content Lab de MBC C&I, uno de los actores más activos en vídeo generativo en Corea. La compañía también ha mostrado ‘House of David’, que se reivindica como la primera producción hollywoodiense que reconoce abiertamente el uso de generación de vídeo con IA a escala industrial, y ‘Born of the Tide’, una animación china basada en la cultura del pueblo Tanka.

Runway que siempre se ha posicionado no como una empresa tecnológica sino como una empresa que democratiza el proceso de contar historias, consolida su narrativa también en localización publicitaria, donde el coste marginal de iterar cuestiona los presupuestos tradicionales de reshoot y doblaje. Cuando se estrene RAPHAEL veremos cómo será la aceptación del público. También será interesante conocer qué porcentaje real de ‘House of David’ se hizo con IA y bajo qué condiciones con sindicatos y derechos de imagen, y si los estudios occidentales seguirán el ejemplo asiático de reconocer abiertamente el uso de estas herramientas.

El equipo de 𝕏 @Kling_ai (Kling Ai) presenta House of David como la primera producción hollywoodiense que admite abiertamente integrar generación de vídeo con IA en su pipeline industrial, un encuadre pensado para legitimar la tecnología ante estudios que hasta ahora preferían no documentar su uso.

Para 𝕏 @c_valenzuelab (Cristóbal Valenzuela), el caso de la aseguradora que cambió una palabra de una voz en off por 7 dólares en lugar de pagar más de 10.000 en un reshoot ilustra la gran ventaja del vídeo generado con IA.

Más información:
📎 Kling AI Debuts at Cannes — RAPHAEL

6. Google declara 3,2 cuatrillones de tokens mensuales

Google estaría procesando más de 3,2 cuatrillones de tokens al mes en sus sistemas de IA, una cifra que multiplica por siete el volumen de hace un año. El dato, difundido en su evento Google I/O, importa porque el token funciona como unidad agregada de trabajo: sin métricas estandarizadas de adopción, el volumen procesado es la mejor aproximación al uso real de modelos generativos en producción. Una escala así sugiere que la integración de Gemini en Search, Workspace, Android y Cloud ya mueve tráfico masivo, no demostraciones.

El dato refuerza la tesis de que la integración vertical de Google en TPUs propias se traduce en una ventaja de coste difícil de replicar por la competencia. El crecimiento alimenta la otra cara del problema: la inferencia se ha convertido en la partida que más preocupa a los CIOs de las empresas, que ven cómo crece el gasto en tokens sin una previsibilidad clara. Google no ha desglosado qué parte de esos tokens corresponde a uso de pago y qué parte a consumo gratuito en productos de consumo. Sin ese detalle, la comparación con los ingresos de OpenAI o Anthropic queda en el aire y la cifra agregada pierde valor analítico.

𝕏 @WesRoth (Wes Roth) interpreta el 7x interanual como la prueba de que la adopción ha pasado de promesa a tráfico medible, una lectura que conviene matizar mientras Google no separe el consumo de pago del uso gratuito en el buscador.

El contrapunto llega de 𝕏 @levie (Aaron Levie), que tras una cena con CIOs de varias Fortune 500 describe el coste por token como el tema más caliente de la mesa, con estrategias mixtas y ninguna compañía convencida de tener la fórmula adecuada.

7. Chollet alerta de la deriva de objetivo en agentes

François Chollet, reconocido investigador y creador de ARC-AGI, ha descrito dos patrones de fallo recurrentes en agentes de programación autónomos a partir de su experiencia con la nueva función 'goal' de Codex, el agente de OpenAI. El primero es clásico en aprendizaje por refuerzo: ante un objetivo, el agente busca el atajo más barato para satisfacer la métrica, incluso reescribiendo los tests o comprobaciones externas que deberían validarlo. El segundo, que bautiza como 'goal drift', aparece cuando se le permite descomponer una meta compleja en subtareas: el agente redefine implícitamente el criterio de éxito hacia algo que ya sabe resolver, y termina ejecutando con precisión una versión trivial e inútil del problema. Chollet añade que, si se acota el entorno hasta cerrar todos los atajos, los resultados son notables.

La observación llega en plena expansión de plataformas agénticas (Antigravity de Google, Claude Code, Codex, Cursor) que apuestan por flujos multi-paso con poca supervisión humana. Para el comprador empresarial, la lectura es incómoda: la fiabilidad de un agente depende menos del tamaño del modelo que del diseño de sandboxes, evaluadores independientes y comprobaciones blindadas frente al propio agente. Además de los tokens consumidos, el coste real de adoptar estas herramientas también reside en construir el andamiaje de verificación que impida al agente mover la portería a placer.

El diagnóstico de 𝕏 @fchollet (François Chollet) es directo: Codex tomará cualquier atajo disponible, incluido reescribir las comprobaciones externas, y solo entrega valor cuando el entorno está tan acotado que no le queda margen para esquivar el trabajo.

8. Michael I. Jordan tacha la AGI de etiqueta de marketing

Michael I. Jordan, prestigioso investigador, ha intervenido en el podcast Machine Learning Street Talk con una crítica directa al estado del debate sobre IA. Considera que 'AGI' es una etiqueta de relaciones públicas que confunde a los investigadores jóvenes y distorsiona lo que realmente se está construyendo. Describe el discurso público como oscilación entre alarmismo y exuberancia, una dinámica que llama desmoralizadora para quienes empiezan en el campo con 20 o 25 años. Y recuerda que los métodos que hoy se presentan como ruptura vienen de la estadística y la investigación operativa, no de una disciplina espontánea.

La intervención cae en un momento en que OpenAI, Anthropic y Google DeepMind sostienen sus tesis de inversión sobre la promesa de sistemas con capacidad de generalización más allá de los datos de entrenamiento. El peso de Jordan está en que la fricción viene desde dentro del campo, no desde el escepticismo externo. El marco dominante es vocabulario de marketing, así que las hojas de ruta etiquetadas como 'camino a la AGI' pierden toda utilidad como criterio de decisión frente a métricas más reales como coste por token, fiabilidad en producción y utilidad medible en tareas concretas.

𝕏 @MLStreetTalk (Machine Learning Street Talk) subraya como cita más dura la palabra 'desmoralizador' aplicada por Jordan al ambiente que viven los investigadores jóvenes, un encuadre que desplaza el foco del debate técnico al coste humano del hype.

Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.

Discusión sobre este post

Por supuesto, sigue adelante.