Inteligencia de datos generativa

OpenAI dice que DALL-E está generando más de 2 millones de imágenes al día, y eso es solo apuestas de mesa

Fecha:

El venerable sitio de imágenes de archivo, Getty, cuenta con un catálogo de 80 millones de imágenes. Shutterstock, un rival de Getty, ofrece 415 millones de imágenes. Tomó algunas décadas construir estas prodigiosas bibliotecas.

Ahora, parece que tendremos que redefinir lo prodigioso. en un del blog la semana pasada, OpenAI dijo que su algoritmo de aprendizaje automático, DALL-E 2, está generando más de dos millones de imágenes al día. A ese ritmo, su producción igualaría a Getty y Shutterstock juntas en ocho meses. El algoritmo está produciendo casi tantas imágenes diarias como toda la colección de sitio de imágenes gratis Unsplash.

Y eso fue antes de que OpenAI abriera DALL-E 2 para todos. Hasta la semana pasada, el acceso estaba restringido y había una lista de espera de personas ansiosas por tener en sus manos el algoritmo. El propósito de la publicación de blog en la que apareció el número fue anunciar que DALL-E 2 ahora está abierto al público en general.

Mientras tanto, algoritmos similares ya están disponibles gratuitamente. El ritmo, entonces, probablemente se acelerará a partir de aquí.

Por supuesto, vale la pena señalar que esta es una comparación imperfecta. La calidad de su imagen promedio de Shutterstock o Getty es mayormente mayor desde el principio, y los sitios también ofrecen imágenes editoriales de eventos actuales. Mientras tanto, DALL-E 2 y otros algoritmos generan múltiples imágenes para cada mensaje, la calidad de la imagen varía ampliamente y el mejor trabajo requiere que lo perfeccione una mano experta.

Aún así, está claro que DALL-E y otras son máquinas de creación de imágenes sin precedentes.

Un lanzamiento por fases

DALL-E 2, lanzado a principios de este año, ha sido la comidilla del mundo de la tecnología.

A diferencia de su predecesor, que OpenAI presentó por primera vez en 2021 y produjo creaciones notablemente imperfectas, DALL-E 2 crea imágenes fotorrealistas con un mensaje de texto. Los usuarios pueden mezclar y combinar elementos, como solicitar una astronauta montando a caballoy estilos, como un nutria de mar al estilo de Chica con un pendiente de perla por Johannes Vermeer.

Para limitar el mal uso y filtrar mejor la salida del algoritmo, OpenAI buscó un lanzamiento por etapas. Entrenado en millones de imágenes y subtítulos en línea, DALL-E 2 y otros algoritmos similares son susceptibles a sesgos en sus conjuntos de datos, así como al uso indebido por parte de los usuarios. OpenAI publicó un artículo sobre DALL-E 2 en abril y presentó una vista previa del algoritmo para 200 artistas, investigadores y otros usuarios. Ampliaron la versión preliminar en 1,000 usuarios a la semana el mes siguiente y luego ampliaron el acceso al algoritmo en versión beta, con precios, a un millón de personas.

“La escalabilidad responsable de un sistema tan poderoso y complejo como DALL-E, mientras se aprende sobre todas las formas creativas en las que se puede usar y maltratar, ha requerido un enfoque de implementación iterativo”, escribió la compañía en la publicación del blog.

Durante el lanzamiento, OpenAI tomó comentarios de los usuarios y los tradujo en arreglos técnicos para reducir el sesgo y filtros para evitar contenido inapropiado. También están empleando un equipo de moderadores para controlar las cosas. Queda por ver qué tan bien escalará este enfoque, a medida que millones de imágenes se conviertan en decenas de millones y más, pero el equipo confiaba lo suficiente en el producto hasta ahora como para seguir adelante con un lanzamiento completo.

Arte de IA en ascenso

El resto del mundo de la IA no se quedó quieto mientras tanto. Los competidores siguieron rápidamente los pasos de DALL-E. Primero fue DALL-E Mini, ahora Craiyon, un generador de imágenes gratuito pero de menor calidad del que se apoderó Internet para fabricar memes. Los algoritmos de mayor calidad incluyen Midjourney y Stable Diffusion. Google incluso se metió en el juego con su algoritmo Imagen (aunque hasta ahora la compañía lo ha mantenido en secreto).

Agréguelos a la producción de DALL-E 2 y el volumen de arte de IA crecerá rápidamente.

A principios de este verano, Stable Diffusion dijo su algoritmo ya estaba produciendo dos millones de imágenes un día durante la prueba. Cuando la plataforma llegó a un millón de usuarios a mediados de septiembre, El fundador de Stable Diffusion, Emad Mostaque, tuiteó, "Deberíamos romper mil millones de imágenes al día más temprano que tarde, imagino, especialmente una vez que encendemos la animación, etc."

La rápida aparición del arte de la IA no ha estado exenta de controversia.

Una pieza de arte de IA generada en Midjourney por Jason Allen ganó recientemente la cinta azul por arte digital en la Feria Estatal de Colorado. No es difícil ver por qué. La pieza es hermosa y evocadora. Pero muchos artistas recurrieron a Twitter para expresar su descontento.

A algunos les preocupa que los algoritmos reduzcan la cantidad de trabajo disponible para los diseñadores gráficos. La combinación de calidad, velocidad y volumen con la habilidad especializada limitada requerida puede significar que las empresas elijan una creación algorítmica rápida en lugar de contratar a un diseñador.

Recientemente, Ars Technica reportaron Shutterstock ya albergaba miles de imágenes de IA. No mucho después de que apareciera, el sitio estaba eliminando algunos. Mientras tanto, Getty prohibió el arte de la IA en su plataforma por completo, citando preocupaciones de derechos de autor. El panorama legal aún es turbio y susceptible de cambiar.

“Por el momento, el contenido generado por IA no se revisará de manera diferente a cualquier otro tipo de presentación de ilustración digital”. Shutterstock dijo Quartz la semana pasada. "Esto puede cambiar en cualquier momento a medida que aprendemos más sobre las imágenes sintéticas".

A otros les preocupa que la capacidad de imitar de cerca el estilo de un artista en activo podría afectar negativamente el valor y la visibilidad de su trabajo. Tampoco está claro qué se debe a los artistas cuyas creaciones ayudaron a entrenar los algoritmos. Desarrolladores expresó una preocupación similar el año pasado cuando OpenAI lanzó algoritmos de codificación entrenados en repositorios abiertos de código.

Pero no todos están de acuerdo en que el arte de la IA reemplazará tan fácilmente a los diseñadores y artistas hábiles una vez que la novedad desaparezca. Y la comunidad puede solucionar aún más los problemas, como decidir entrenar algoritmos solo en obras de dominio público o permitir que los artistas opten por no participar. (Ya hay una herramienta para artistas para ver si sus creaciones están incluidas en los datos de entrenamiento).

Cuando el polvo se asienta

Los algoritmos de aprendizaje automático han generado imágenes y texto extraños y novedosos, pero no particularmente útiles durante años. La IA que podría generar un trabajo de calidad apareció por primera vez en 2020 cuando OpenAI lanzó el algoritmo de lenguaje natural GPT-3. El algoritmo podía producir texto que, a veces, era casi indistinguible de algo escrito por un humano. GPT-3 es ahora, como DALL-E 2, un producto pago y también un productor prodigioso.

Pero a pesar de lo grande que era GPT-3, DALL-E 2 puede tomar la delantera. "Hemos visto mucho más interés del que habíamos anticipado, mucho más grande de lo que fue para GPT-3", dijo Peter Welinder, vicepresidente de productos y asociaciones de OpenAI. les dijo a MIT Technology Review en julio.

No es probable que la tendencia termine con las imágenes. Los desarrolladores de IA ya están mirando el video. La semana pasada, Meta lanzó quizás el algoritmo de este tipo más avanzado hasta el momento. Aunque su producción aún está lejos de ser perfecta, el ritmo de mejora sugiere no tendremos que esperar mucho.

Cuando el polvo se asiente, es posible que estos algoritmos se establezcan como una nueva forma de arte. La fotografía enfrentó una resistencia similar a su llegada en el siglo XIX y, en última instancia, en lugar de suplantar las formas de arte existentes, se unió a sus filas.

“Lo que ha sido cierto desde al menos el advenimiento de la fotografía sigue siendo cierto ahora: el arte que nace a medias es el más emocionante. Nadie sabe qué puede ser una nueva forma de arte hasta que alguien descubre qué es”, Stephen March recientemente. escribió en el Atlántico. “Descubrir qué es el arte de la IA será tremendamente difícil, tremendamente alegre. Comencemos ahora."

Crédito de la imagen: OpenAI

punto_img

Información más reciente

punto_img

Habla con nosotros!

¡Hola! ¿Le puedo ayudar en algo?