Robotaxis, voces en el metaverso, cine y lluvia de millones en IA
Noticias recientes de Inteligencia Artificial y Negocios
Hacemos un repaso del estado de la conducción autónoma a partir de una anécdota ocurrida en San Francisco. Contamos cómo Meta está tratando de hacer la síntesis de voz que exprese emociones, y cómo la IA generativa va a transformar profundamente industrias como la del doblaje de cine. Además, analizaremos qué está pasando en el mundo de las startups de IA en EE.UU., por qué estamos viviendo un periodo de fuerte inversión y si podríamos estar frente a una burbuja similar a la provocada por las ‘puntocom’ en el año 2000.
Robotaxis hasta el Amanecer
Dentro del área metropolitana de San Francisco, la empresa Cruise, perteneciente a General Motors, opera una flota de taxis con nivel 4 de autonomía, llamados en el argot de IA robotaxis. Sólo funcionan por la noche, reduciendo así el número de situaciones imprevistas a las que se tiene que enfrentar. Lo que seguramente no esperaban los ingenieros de Cruise fue lo que sucedió una de esas noches, cuando uno de los vehículos circulaba por las calles de San Francisco y una patrulla de policía le dio el alto. En un video grabado por un peatón, se aprecia cómo el agente se acerca al vehículo y, sorprendido al no ver ninguna persona al volante, trata de abrirlo sin éxito. El coche permanece parado para no provocar un atropello, y hasta aquí todo correcto. Pero en cuanto el agente se aleja para avisar por radio, algo bastante habitual, el coche aprovecha la ocasión para darse a la fuga, provocando las risas de todos los viandantes.
Esta situación tan rocambolesca ilustra lo difícil que es lograr una conducción autónoma universal. Cruise ha respondido a este incidente indicando que el comportamiento del vehículo autónomo fue el esperado: se desplazó a un lugar más seguro para detenerse y no bloquear la vía. Seguramente, para el policía, no era el movimiento que estaba esperando.
Y es que a pesar de la llegada del deep learning, el elemento más impredecible para una máquina sigue siendo el comportamiento humano.
Más información: https://electrek.co/2022/04/10/gm-cruise-autonomous-taxi-pulled-over-by-police-in-san-francisco-without-humans-bolts-off-u-cruise-responds/
Voz Sintética, pero con Emoción
Todos hemos sido testigos en los últimos años de la importante mejora en la calidad de los sistemas TTS (Text-to-Speech por sus siglas en inglés). Los primeros sistemas TTS comerciales surgieron en los 80. La voz que producían tenía un sonido robótico inconfundible.
Gracias a los avances en Inteligencia Artificial producidos por las redes neuronales, hoy podemos generar una voz mucho más natural y sin ese efecto robótico. Sin embargo, la voz sintetizada sigue presentando una entonación neutra, carente de expresividad e incapaz de transmitir emociones. Para una interacción sencilla con asistentes como Siri o Alexa puede ser más que suficiente. Pero no para las aplicaciones que Meta tiene en mente desarrollar en los próximos años.
Por eso ha presentado un sistema capaz de sintetizar voz con una emoción determinada. Lo primero que sorprende es que no utiliza texto en el proceso; es decir, altera el audio de la voz diciendo lo mismo pero expresado con una emoción particular. Analizando los ejemplos que han mostrado, también sorprende cómo se añaden risas, pausas, y otras señales acústicas no verbales que ayudan a comunicar la emoción deseada. Esto es un trabajo de investigación fundacional, a partir del cual se construirán los futuros asistentes virtuales. El mundo de la película ‘Her’ quizá esté hoy un poco más cerca.
Más información: https://ai.facebook.com/blog/generating-chit-chat-including-laughs-yawns-ums-and-other-nonverbal-cues-from-raw-audio/
Doblaje de Cine Automático
Y hablando de cine, algo que se comentaba mucho en los mentideros de la Inteligencia Artificial por fin ha ocurrido. Se acaba de presentar la primera película doblada de forma automática al inglés. Para ello han empleado técnicas de IA generativa similares a las de los famosos Deepfakes.
La película se llama ‘The Champion’ y se creó inicialmente para el mercado polaco. Tras gozar de un gran éxito en taquilla, los productores se plantearon exportarla a otros mercados. Como no existe una industria muy desarrollada de dobladores en inglés, cuando una película extranjera se logra colar en los mercados de habla inglesa siempre lo hace con subtítulos. Leer subtítulos no es lo ideal para ver una película, ya que nos desvía la atención de la escena. Esto provoca que sólo las películas de habla no inglesa realmente excepcionales logren hacerse un hueco en el mercado internacional. El doblaje de películas es una industria muy desarrollada en países donde el inglés no está muy implantado en la sociedad, como por ejemplo en España. Pero tampoco es lo ideal para el visionado, al no coincidir el movimiento de labios del idioma original con el idioma doblado.
Para subsanar todos estos problemas y automatizar el proceso de doblaje, surgen nuevas soluciones basadas en IA. El proceso para lograr doblar al inglés ‘The Champion’ todavía es algo rudimentario, pero ha permitido hacerlo después de producir la película y una vez se ha podido validar su éxito comercial. Para ello los actores han vuelto a grabar los diálogos en inglés (aunque sin tener que actuar), ante 5 cámaras que recogían el movimiento de sus labios desde distintos ángulos. Con esta información, se ha modificado el film original para reemplazar el diálogo y mediante un modelo neuronal, adaptar los labios de los actores al nuevo idioma.
La desventaja de este método es que los actores han de conocer el idioma destino, lo cual no es viable si pensamos en otros idiomas que no sean el inglés. Pero esto es sólo la primera aproximación.
Conforme estas técnicas avancen, se podrán aplicar los cambios directamente sobre la película ya producida, con el mismo timbre de voz de los protagonistas, para cualquier idioma, y sin tener que molestar a los actores originales.
Empresas como Flawless AI están detrás de un producto con estas características que promete cambiar la industria del cine para siempre.
Más información: https://www.fxguide.com/fxfeatured/the-neural-rendering-of-the-champion/
Inversión en IA: Continúa la Fiesta
Según el último informe AI Index publicado por la Universidad de Stanford, la inversión privada en Inteligencia Artificial se ha duplicado en 2021 con respecto al año anterior, superando los 93 mil millones de dólares. Y a juzgar por lo que estamos viendo en este inicio de 2022, no parece que la tendencia se haya frenado. Hoy nos hacemos eco de varias noticias del mes de abril que anuncian fuertes inversiones en empresas basadas en IA de muy diversa índole. Definimos “empresa basada en IA” como aquella empresa cuya principal fuente de ingresos depende de un producto, que sólo es posible por medio de los últimos avances en Inteligencia Artificial.
Empezamos con Viz.ai, una empresa del sector sanitario que aplica visión artificial para acelerar el diagnóstico médico. Acaba de anunciar una ronda de inversión 100 millones de dólares. Lo sorprendente es que sólo ha pasado un año desde que cerrara la anterior ronda de 71 millones. Seguimos con Agility Robotics, presentando una ronda de 150 millones para seguir desarrollando un robot bípedo, orientado a trabajos rutinarios que se dan en un almacén y en coexistencia con humanos. Observe.AI es otra de las empresas basadas en IA que acaba de cerrar una ronda de 125 millones de dólares, para crecer su producto dedicado a la monitorización inteligente (conversaciones telefónicas, emails, etc.) de los centros de atención al cliente. Y en China, la startup Laiye ha levantado 150 millones de dólares para crecer su software para el mercado de RPA (Robot Process Automation, por sus siglas en inglés), cuyo objetivo es la automatización de las tareas repetitivas que ocurren en el ámbito de una oficina.
Y la lista no acaba aquí. También en abril han cerrado rondas de 2 dígitos Built Robotics, Mutiny, Unlearn.AI, BlueOcean, Lilt, o Diligent. Esta variedad de empresas basadas en IA confirma el carácter transversal de esta tecnología y el gran impacto que ya tiene en todos los sectores de la economía.
La escasez de perfiles con conocimiento en IA, tanto técnicos y como directivos, está también contribuyendo a que se cierren rondas con esas cifras y a gran velocidad, con el fin de poder pagar los elevados salarios demandados.
Por el momento, nada parece indicar que estemos camino de otro invierno de la IA o de una burbuja similar a las ‘puntocom’. Estas empresas tienen productos viables y con un beneficio claro para la multitud de mercados a los que están orientados. Otra cosa es que todas logren ser tan eficaces como prometen; y rentables teniendo en cuenta unos costes operativos mucho mayores que los que tienen las empresas tradicionales de SaaS (Software as a Service, por sus siglas en inglés). Pero, si algo nos ha enseñado últimamente la IA, es que acabar con los problemas de eficacia y rentabilidad es sólo cuestión de tiempo.
Más información: https://www.nytimes.com/interactive/2022/04/19/technology/tech-startup-bubble.html