Los grandes centros de investigación aplicada en Inteligencia Artificial, Google-DeepMind, Microsoft-OpenAI y Facebook, exhiben sus creaciones en la pasarela de la IA y sacan pecho mejorando el estado del arte. Mientras esto sucede, Europa, sin traje para este desfile, por fin despierta de su letargo y descubre que se está quedando atrás con respecto a EE.UU. y China. Analizaremos cuáles son los planes de Europa y si aún estamos a tiempo de revertir la situación.
Imagen vs. DALL·E 2
Tan sólo un mes después de que OpenAI tambaleara los cimientos del diseño gráfico presentando DALL·E 2, el equipo de Google Brain ha puesto sus cartas sobre la mesa publicando un modelo que hace lo mismo llamado Imagen. Estos modelos generan imágenes de muchos estilos a partir de una descripción escrita en lenguaje natural, componiendo las imágenes con cualquier texto, por muy loco que parezca, y combinando ideas que el modelo sólo ha visto por separado durante el entrenamiento. Por ejemplo, podemos generar la foto de un astronauta montando a caballo, o una ilustración de unos osos de peluche disfrazados de científicos locos que mezclan productos químicos.
DALL·E 2 es el primer ejemplo que nos permite responder con un sí rotundo a la pregunta de si la IA puede ser creativa, algo que nadie se esperaba hace 10 años.
Imagen mejora considerablemente las prestaciones de DALL·E 2, con un modelo que, además, ha sido entrenado con un menor número de parámetros. Debido a que la calidad de generación de imágenes es una medida subjetiva, Google ha utilizado un panel de humanos para comparar la calidad de Imagen frente a otros modelos como DALL·E 2 en base a dos criterios: alineamiento de la imagen con respecto al texto descriptivo y fidelidad de la imagen con respecto a lo que se esperaría de un diseñador gráfico o un fotógrafo. Según esta evaluación, que cuenta con 200 descripciones elegidas por Google para explotar distintas capacidades generativas, las imágenes de Imagen son mejor valoradas por los panelistas en ambos criterios y para todos los modelos con los que se ha comparado.
Una de las limitaciones de DALL·E2 es la escritura de texto en las imágenes producidas, algo que Imagen parece hacer solucionado por completo, como podemos ver en la imagen de la derecha. La asignación correcta de colores a los objetos de una imagen es algo en lo que Imagen también ha superado a su predecesor. Por ejemplo, si la descripción indica “una mochila verde y una manzana negra”, DALL·E 2 tiende a generar una manzana verde y una mochila negra, ya que son los colores habituales de estos objetos. Imagen no cae en este error, indicando que comprende mejor el contenido de la descripción. Sin embargo, una característica muy interesante, desde un punto de vista comercial de DALL·E 2 y que no hemos visto en Imagen, es la capacidad de editar imágenes a través de un sencillo interfaz: seleccionamos una zona, y el modelo genera únicamente los píxeles de esa zona siguiendo una nueva descripción y manteniendo la coherencia con el resto de píxeles de la imagen que no se modifican.
La mala noticia es que este potente modelo no estará disponible para el público general, ya que Google antepone los potenciales peligros del mal uso de una herramienta así al interés general. Otro de los motivos que argumenta para no publicar el modelo es que, dado que está entrenado con imágenes de Internet, contiene sesgos que provocan que las personas de piel clara aparezcan con mayor probabilidad y las profesiones se asignen a un género concreto. En un sistema generador de imágenes, los sesgos no tienen consecuencias negativas sobre las personas: basta con cambiar la descripción para producir los rasgos étnicos o o el género deseado. Aún así, Google ha preferido no exponerse.
Más info: https://imagen.research.google
OPT-175B vs. GPT-3
En Junio de 2020 se publicaba GPT-3, un modelo de lenguaje con 175 mil millones de parámetros que dejaba al mundo atónito ante la capacidad de realizar tareas de procesamiento de lenguaje natural para las que no había sido entrenado explícitamente. OpenAI es la empresa que está detrás de este hito. En la actualidad explota comercialmente GPT-3 en una modalidad de pago por uso, que depende del número de palabras introducidas al modelo como contexto y del número de palabras generadas por este como respuesta. Casi dos años después, Meta anuncia la publicación de un modelo lenguaje llamado OPT-175B, que es idéntico a GPT-3 en cuanto a número de parámetros y disponible de forma gratuita siempre que sea para fines no comerciales.
Además del modelo de lenguaje listo para su uso, Meta también ha publicado el código fuente para poder entrenarlo desde cero y desplegarlo como un servicio en la nube. El coste de entrenamiento de un modelo de estas características es del orden de millones de dólares. Pero una vez entrenado, el coste de uso se vuelve mucho más asequible. Por ejemplo, utilizando la información que ha proporcionado Meta, el coste de utilizar OPT-175B en la nube podría estar en torno a los 60€ la hora. El código de Meta, además, es capaz de entrenar el modelo con una huella de carbono 7 veces inferior a la empleada para entrenar GPT-3.
Este movimiento de Meta es una declaración de intenciones para seguir empujando una investigación de carácter abierto en el campo del deep learning, algo que, sin duda, ha contribuido a los grandes avances en Inteligencia Artificial que hemos vivido en la última década.
Más info: https://ai.facebook.com/blog/democratizing-access-to-large-scale-language-models-with-opt-175b/
Y Europa se pone las pilas
El primer paso para solucionar un problema es reconocer que lo tienes, y eso parece haber descubierto Bruselas, según se desprende del último informe publicado por el Parlamento Europeo y titulado “Sobre la Inteligencia Artificial en la Era Digital”. Hace escasamente un año, la Comisión Europea se apresuró en presentar la primera propuesta de regulación sobre Inteligencia Artificial que conoce el mundo. Ahora es el Parlamento Europeo el que mueve ficha, y publica este informe para preparar el terreno de la futura regulación que afectará a los países miembros de la Unión Europea.
En el inicio de este informe, se hace un detallado análisis de la situación actual, reconociendo que Europa se ha quedado atrás con respecto a China y EE.UU. en esta cuarta revolución industrial. También llama la atención la resignación al reconocer que EE.UU. lidera los principales negocios digitales, que debido a los efectos de red, impiden que puedan aparecer más competidores y deja el pastel para unos pocos. Según el informe, de los principales 200 negocios digitales a nivel mundial, sólo 8 tienen su sede en Europa. Probablemente, si hubieran elegido los 100 primeros, la estadística sería mucho más cruel. Esta concentración de negocios digitales en EE.UU. propicia para ese país un mayor grado de innovación, más atracción de talento, y beneficios fuera de lo común. Reconoce también el carácter estratégico de la IA y su potencial para transformar la economía. Ante esta situación, ¿qué sugiere el informe que debemos hacer?
Primero, crear un marco normativo favorable, con un “enfoque europeo” centrado en las personas. Segundo, seguir con la culminación del mercado único, para evitar la fragmentación y contribuir al crecimiento de nuestras empresas con mercados similares en tamaño a los que tienen EE.UU y China. Además, un aumento en la inversión en investigación, donde todavía gozamos de cierto prestigio internacional. Fomentar medidas para que la industria acceda a la financiación y el talento necesarios: para que siga siendo competitiva y no se quede atrás. Y otras muchas medidas orientadas a mejorar la relación de las personas y las empresas con la tecnología, además de algunas referencias al uso de la IA en áreas críticas como la seguridad nacional y defensa.
Lo más impactante de este informe es su conclusión final: es necesario actuar urgentemente.
A pesar de esta demoledora conclusión, parece que, ser pioneros en una regulación sobre Inteligencia Artificial es el único espacio que le queda a la Unión Europea para tener voz en el panorama internacional. Esperamos que la posición de desventaja en la que nos encontramos, muy bien caracterizada en este informe, tenga un importante peso en la futura ley, para que no impacte negativamente en la competitividad de nuestras empresas y en el desarrollo tecnológico de Europa.
Más info: https://www.europarl.europa.eu/doceo/document/A-9-2022-0088_ES.html
Gracias por leer Explicable. Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda gustar.