El vídeo generado con IA está superando la zona del valle inquietante

Cada vez son más los creativos que integran la IA en sus flujos profesionales.

Miguel A. Román

may 27, 2026

Fotograma de la serie “House of David” cuyo creador admite haber usado IA.

¿Qué pasó ayer? En un minuto:

El vídeo generado por IA ya no genera sensación de rechazo en su adopción y se convierte en producción audiovisual premium viable, rápida y barata.
MAI-Image-2.5, dentro de la iniciativa de Microsoft para no depender de OpenAI, debuta en el tercer puesto de modelos texto-a-imagen de Arena.
Qwen3.7-Max debuta cuarto en Code Arena, situando a Alibaba como el laboratorio chino mejor clasificado del tablero.
Alipay lanza un sistema de pagos específico para agentes, la tesis agent-first deja de ser retórica y empieza a tener infraestructura.
Anthropic está endureciendo cómo controla a Claude a medida que le da más acceso real. Además añadirá una puntuación al usuario que mida su soltura.
Ethan Mollick sostiene que muchos usuarios siguen infravalorando la IA actual, y cuestiona qué se puede delegar a la IA y qué no.
SemiAnalysis apunta a que el cuello de botella de la IA ya no está solo en la disponibilidad de GPUs, sino también en mover memoria y producir la energía para alimentar racks.

Y si tienes más de un minuto…

1. El contenido generado por IA está cruzando el valle inquietante

Runway ha presentado Project Luxo, una iniciativa con la que defiende que el vídeo generado por IA empieza a superar su mayor barrera comercial: dejar de parecer “artificial” y empezar a funcionar como contenido narrativo. La compañía mostró tres cortometrajes y un anuncio ficticio creados íntegramente con IA a perfiles del ecosistema audiovisual como productores, estudios, talento, prensa y otros actores de la industria, y asegura que la reacción se centró más en la historia que en la tecnología. La IA de vídeo ya no compite con el vídeo real solo en calidad visual, sino en coste, velocidad y capacidad de producción. Según Runway, las piezas fueron realizadas por una sola persona en plazos que van desde cuatro horas hasta tres semanas, una escala que antes habría requerido equipos, presupuesto y procesos mucho más amplios.

El caso más relevante para el negocio es un anuncio ficticio de una marca de relojes: superó los 100 millones de visualizaciones en Instagram en 48 horas, sin que la conversación se centrara mayoritariamente en que estaba hecho con IA. Runway presenta estos resultados como evidencia temprana de que el contenido generado por IA está empezando a salir de la zona de valle inquietante que se produce dentro del ciclo de adopción de una nueva tecnología. En este contexto, el valle inquietante es el punto en el que una imagen, una voz o un personaje generado por IA se parece mucho a algo real, pero no lo suficiente. El resultado provoca rechazo porque el cerebro detecta pequeñas rarezas: una mirada rígida, una piel demasiado perfecta, gestos poco naturales, manos extrañas, movimientos que no encajan o una emoción que parece falsa.

Por otro lado, Kling AI, el modelo de vídeo de la empresa china Kuaishou, ha reforzado su posicionamiento en el sector audiovisual con el mismo mensaje, vinculando su herramienta a producciones profesionales y a usos narrativos más allá de la demo técnica. Persisten preguntas clave sobre derechos, consentimiento, trabajo creativo, transparencia y responsabilidad. Pero la realidad es que el vídeo generado por IA ya se puede integrar en flujos profesionales por creadores, estudios, marcas y empresas, y producir vídeo premium deja de ser un privilegio de grandes presupuestos.

𝕏 @c_valenzuelab (Cristóbal Valenzuela) pidió dedicar quince minutos a ver estos cortos porque, a su juicio, cambian la percepción sobre los plazos de desarrollo y sobre lo que ya puede hacerse con vídeo generado por IA.

𝕏 @Kling_ai (Kling Ai) difundió el testimonio de Jon Erwin, que presenta la herramienta como pieza central en las temporadas 1 y 2 de “House of David” y la asocia a varios hitos para la industria.

Más información:

📎 Project Luxo

2. Microsoft estrena MAI-Image-2.5 y entra en el top 3

Microsoft ha presentado MAI-Image-2.5, la nueva versión de su modelo propio de texto a imagen, desarrollado por el equipo de Microsoft AI que dirige Mustafa Suleyman. Debuta tercero en el leaderboard de Arena, la plataforma que ordena modelos según preferencias humanas en comparaciones a ciegas, con 1.254 puntos, 72 más que MAI-Image-2. El lanzamiento ataca los puntos débiles habituales de los modelos de difusión: renderizado de texto legible en pósters y etiquetas, coherencia de layouts y tratamiento de luz y composición. Son justo las barreras que frenan la adopción en publicidad, packaging y diseño editorial.

En paralelo, consolida la familia MAI como línea propia de modelos fundacionales cuyo objetivo es reducir la dependencia de Microsoft con OpenAI. Hasta este lanzamiento, el top 5 de Image Arena estaba ocupado únicamente por modelos de Google y OpenAI. El modelo está disponible en vista previa a través de Arena, con despliegue previsto en las próximas semanas en MAI Playground y en Microsoft Foundry, la plataforma para desarrolladores empresariales. Build, la conferencia anual de desarrolladores de Microsoft, se celebra dentro de una semana, ventana en la que la compañía ha anticipado más anuncios del equipo de IA.

Para 𝕏 @mustafasuleyman (Mustafa Suleyman), el salto del modelo está en los detalles que separan una imagen vistosa de una utilizable en trabajo profesional: el texto de un póster, la etiqueta de un envase o cómo cae la luz sobre una escena, áreas donde los generadores actuales siguen fallando.

Desde 𝕏 @arena (Arena.Ai) subrayan que el top 5 del Text-to-Image Arena estaba reservado hasta ahora a Google DeepMind y OpenAI, por lo que la entrada de un tercer laboratorio rompe una concentración que llevaba meses sin moverse.

𝕏 @WesRoth (Wes Roth) interpreta la mejora de 72 puntos sobre MAI-Image-2 como un salto cualitativo serio dentro del catálogo propio de Microsoft, más que como un retoque incremental entre versiones.

𝕏 @howfxr (Howfxr) pone el foco en la distribución: el despliegue progresivo a MAI Playground y Foundry en las próximas dos semanas es lo que convertirá al modelo en una opción comercial real, más allá del escaparate de Arena.

Más información:

📎 MAI-Image-2.5 launches at No. 3 on Arena | Microsoft AI

3. Qwen3.7-Max se cuela en el top de Code Arena

Qwen3.7-Max, la última iteración del modelo de Alibaba, ha debutado en el cuarto puesto de Code Arena: Frontend, el ranking que mide a los grandes modelos en tareas agénticas de desarrollo web. El modelo construido el 17 de mayo de 2026 se sitúa como el laboratorio chino mejor posicionado del leaderboard, por delante de GLM-5.1 de Zhipu, y empata con Claude Opus 4.6 de Anthropic en este vertical. La generación autónoma de código frontend, con razonamiento multi-paso y uso de herramientas, es uno de los casos comerciales más activos del año, dominado hasta ahora por Anthropic y OpenAI.

Este paso confirma que la distancia entre los grandes laboratorios chinos y los líderes occidentales se estrecha en capacidades concretas, no solo en benchmarks generalistas. El modelo figura también décimo en Design Arena con un Elo de 1313, en la franja de DeepSeek V4 Pro y Meta Muse Spark.

Desde 𝕏 @arena (Arena.Ai) enmarcan el debut como un hito específico: Qwen3.7-Max es ya el laboratorio chino mejor clasificado del tablero, superando a GLM-5.1 y empatando con Claude Opus 4.6 en desarrollo web agéntico.

En 𝕏 @Alibaba_Qwen (Qwen) leen el resultado como confirmación de su trayectoria en codificación agéntica y anticipan más lanzamientos cercanos, sin concretar fechas ni próximos modelos.

Para 𝕏 @WesRoth (Wes Roth), compartir franja con DeepSeek V4 Pro y Meta Muse Spark en Design Arena valida la madurez de la familia más allá del vertical de código, y el caching implícito recién activado reduce coste y latencia sin tocar la integración existente.

Más información:

📎 WebDev AI Leaderboard - Best AI Models for Web Development

4. El software entra en fase agent-first

Varias señales del día apuntan a que los agentes empiezan a operar como capa de ejecución sobre productos, pagos y plataformas sociales.

Alipay ha presentado una solución de pagos full-stack para la economía agéntica, con dos servicios nuevos, AI Wallet y Token Pay, dirigidos a empresas de IA, retailers y otros socios que prevén transacciones iniciadas por agentes autónomos.
Higgsfield, hasta ahora conocida por generación de vídeo e imagen, ha añadido conectores sociales a su Higgsfield Supercomputer para que los agentes lean y publiquen en X, Instagram, Threads y LinkedIn, cubriendo un ciclo de marketing completo.
Atomic Bot ha lanzado una app para iOS que actúa como mando a distancia de Hermes Agent, un agente autoalojado que corre 24/7 en un servidor privado del usuario al estilo de OpenClaw.
Helio ha pasado a beta pública con un planteamiento distinto: el usuario describe un objetivo en lenguaje natural y una especie de RR.HH. integrado traduce eso en un equipo de agentes operativo en menos de 60 segundos, con roles y alcance definidos.
Capafy, por su lado, ha abierto un marketplace de skills en el que los creadores fijan precio y la lógica se ejecuta en servidor, sin exponer la metodología, frente al modelo open-source por defecto del resto de marketplaces de skills.

Para 𝕏 @naval (Naval), la secuencia desktop-first, mobile-first y agent-first no es una metáfora: implica que el cliente principal del software dejará de ser una persona navegando una UI para ser un agente que consume APIs en su nombre.

𝕏 @WesRoth (Wes Roth) subraya que Alipay, uno de los mayores procesadores de pagos del mundo, se coloca como infraestructura financiera para agentes presionando a Visa, Mastercard y Stripe a ofrecer pasarelas equivalentes para flujos máquina-a-máquina.

𝕏 @levie (Aaron Levie) observa que muchas empresas fuera de Silicon Valley están contratando ingeniería precisamente para adoptar agentes: hace falta perfiles técnicos y forward-deployed engineers que construyan e integren estos sistemas dentro de la operación, no solo licencias.

𝕏 @pmddomingos (Pedro Domingos) ironiza con que bastaría con que las compañías SaaS renombren sus módulos como agentes para inflar su valoración, una pulla a la dilución del término en marketing corporativo.

Desde 𝕏 @DeepLearningAI (Deeplearning.Ai) recogen el trabajo de Zora Z. Wang en Carnegie Mellon y Stanford para advertir que los benchmarks actuales miden la capacidad agéntica solo de forma estrecha, lejos del rango de tareas económicamente valiosas que se les atribuye en el discurso.

Más información:

📎 Atomic Bot | The Fastest Way to Run OpenClaw

📎 Helio launches invite-only AI-powered team workspace

📎 Capafy launches AI Skills Marketplace for creators

5. Anthropic ajusta el cerco operativo de Claude

Anthropic ha concentrado varios cambios alrededor de una misma idea: Claude ya opera con más acceso y necesita más contención técnica. En su blog de ingeniería, la compañía explica que los permisos de los agentes deben evolucionar con sus capacidades y sitúa el sandboxing como mecanismo central para limitar acciones potencialmente destructivas. El dato más revelador es operativo: hace un año habrían descartado dar a Claude acceso suficiente para tumbar un servicio interno de la empresa, y hoy ese nivel de acceso forma parte del uso habitual en algunos entornos.

A la vez, la firma está reforzando Claude Code con un plugin de guía de seguridad para detectar y corregir vulnerabilidades mientras se escribe código, un punto sensible para equipos de desarrollo y clientes empresariales. Y por último tenemos AI Fluency, una puntuación que Anthropic dará al usuario basada en conversaciones previas en Chat, Cowork y Claude Code. La función AI Fluency se apoya en 11 criterios y las referencias detectadas apuntan a una pantalla específica dentro de los ajustes de Claude. Si se hace bien, podría servir como indicador en procesos de selección para evaluar la destreza en el uso de la IA de los candidatos.

𝕏 @WesRoth (Wes Roth) destaca el nuevo plugin de guía de seguridad para Claude Code, disponible en el marketplace, como una herramienta para identificar y corregir vulnerabilidades durante la escritura de código.

𝕏 @emollick (Ethan Mollick) critica que los cambios en la interfaz de Claude se documenten mal, hasta el punto de generar callejones sin salida, y pone como ejemplo la migración de learning mode a una skill que no aparece explicada ni parece estar disponible.

𝕏 @testingcatalog (Ai News | Testingcatalog) interpreta AI Fluency como una función orientada a evaluar el uso que hace el usuario de Claude, con un scorecard basado en conversaciones anteriores en Chat, Cowork y Claude Code y medido sobre 11 criterios.

Más información:

📎 How we contain Claude across products

📎 Anthropic to introduce AI Fluency scorecard in Claude (link extraído de los tweets)

6. Mollick recalibra expectativas sobre la IA actual

Ethan Mollick ha concentrado en varios mensajes una idea simple: el debate sobre la IA sigue usando marcos viejos para juzgar sistemas que ya operan en entornos más complejos y útiles. Sitúa el foco en los llamados harnesses, configuraciones con herramientas y memoria que amplían lo que un modelo puede hacer en trabajo profesional, y añade que las señales más relevantes ya no vienen de observadores externos, sino de especialistas en áreas como derecho o matemáticas. Junto a eso, introduce dos objeciones concretas al discurso dominante: que las ventanas de contexto muy largas pueden empeorar la experiencia al arrastrar información antigua a respuestas nuevas, y que parte de la cobertura mediática sigue evaluando la IA con modelos gratuitos o desactualizados.

También lleva la discusión al terreno práctico en su ensayo Choosing to Stay Human, centrado en decidir qué conviene mantener en manos humanas y qué puede delegarse. Ya no basta con preguntar qué tareas puede hacer una máquina, sino cuáles no conviene delegar. Ethan advierte que el riesgo no está en usar IA, sino en convertirla en el modo automático para escribir, decidir o aprender. Su tesis: “seguir siendo humanos” implica elegir cuándo usar la IA y cuándo preservar el esfuerzo propio. Y como cierre a su posicionamiento, en su crítica al artículo de Wired sobre fact-checking no niega el valor de los verificadores humanos: plantea que la IA puede servir como primera pasada y liberar tiempo para tareas de juicio, contraste y resolución de conflictos.

𝕏 @emollick (Ethan Mollick) sostiene que la mayoría de la gente no percibe hasta qué punto los sistemas actuales son capaces cuando trabajan dentro de harnesses, y subraya que ahora esa valoración llega también de expertos en derecho y matemáticas, no solo de no especialistas.

Más información:

📎 Choosing to Stay Human - by Ethan Mollick (link extraído de los tweets)

📎 I’m a Professional Fact-Checker. AI Is Wrong More Often Than You Think | WIRED

7. SemiAnalysis disecciona la pila de cómputo IA

La próxima gran revolución de la inteligencia artificial no está solo en los chips, sino en cómo se alimentan. SemiAnalysis anticipa que los centros de datos empezarán a migrar hacia arquitecturas de 800 voltios en corriente continua, una forma de llevar electricidad a los racks de servidores con menos pérdidas, menos cobre y más capacidad para soportar la demanda extrema de la IA. La firma estima que esta tecnología podría alimentar unos 39 GW de nueva capacidad para 2030.

SEl cambio responde a una presión muy concreta: los racks de IA están pasando de consumir decenas de kilovatios a cientos, con diseños que pueden acercarse a los 600 kW o más. A esos niveles, las arquitecturas eléctricas actuales empiezan a ser caras, voluminosas e ineficientes. NVIDIA también defiende el paso a 800 VDC porque permite reducir conversiones eléctricas, liberar espacio para computación y preparar racks de más de 1 MW.

Para los negocios, la lectura es clara: la electricidad se convierte en una ventaja competitiva. Los ganadores no serán solo fabricantes de GPU, sino proveedores de rectificadores, sistemas de respaldo, busways, electrónica de potencia y nuevos transformadores de estado sólido. Google, Meta y Microsoft ya han impulsado especificaciones abiertas para racks de alta densidad dentro de OCP (Open Computer Platform), una señal de que el estándar empieza a moverse desde el laboratorio hacia el mercado.

𝕏 @ID_AA_Carmack (John Carmack) dice que SemiAnalysis le resulta especialmente útil porque amplía su visión de sistema más allá de lo habitual, tanto hacia arriba, con el centro de datos, como hacia abajo, con capas más profundas del hardware.

𝕏 @SemiAnalysis_ (Semianalysis) desglosa la latencia extremo a extremo de un LLM en dos mitades casi iguales: alrededor del 48% en llenado de nuevos datos + cache y el 52% en generación de tokens.

Más información:

📎 Inside the 800VDC Revolution – Part 1

Gracias por leer 1 Minuto de IA. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda interesar.

Discusión sobre este post

Por supuesto, sigue adelante.