¿Qué es DALL-E de OpenAI? y ¿Por qué puede ser importante?

Vamos a hablar sobre una destreza de Inteligencia Artificial que ha estado mucho tiempo en las noticias: DALL-E de OpenAI. El modelo de aprendizaje capaz de generar imágenes muy precisas respecto a un texto creado por un ser humano.

¿Qué es Open AI? La empresa creadora de Chat GPT

Dall-E es un auténtico artista automático basado en la inteligencia artificial y por ello, le han dado el nombre en honor al reconocido pintor Dalí y el robot Wall-E de Pixar.

¿Qué es DALL-E?

Entonces, ¿Qué es DALL·E? En julio de este año, GPT-3 de OpenAI pudo generar artículos de opinión, poemas, sonetos y código informático.

DALL·E es una versión de 12 mil millones de parámetros del modelo GPT-3 Transformer que interpreta entradas de lenguaje natural (como por ejemplo “un bolso de cuero verde con forma de pentágono”) dada por un ser humano, y se encarga de generar las imágenes correspondientes.

DALL·E de OpenAI puede generar un gran conjunto de imágenes a partir de solamente eso, trazas de palabras. Luego, las imágenes se clasifican según un segundo modelo de OpenAI.

Este es denominado CLIP, e intenta determinar qué imagen coincide mejor con las imágenes más comunes sobre temas relacionados a los buscados; ejecutando así, una completa tarea como editor de fotos.

¿Qué es Chat GPT? ¿Cómo usarlo? Todo lo que necesitas saber sobre el bot impulsado por IA

¿Cómo fue construido Dall E?

Dall E utiliza la misma arquitectura de red neuronal que es responsable de toneladas de avances recientes en Machine Learning: El Transformador.

Los transformadores son un tipo de red neuronal fácil de paralelizar que se puede ampliar y entrenar en grandes conjuntos de datos. Han sido particularmente revolucionarios en el procesamiento del lenguaje natural, mejorando la calidad de los resultados de la Búsqueda de Google y la traducción.

La mayoría de estos grandes modelos de lenguaje están entrenados en enormes conjuntos de datos de texto como Wikipedia o rastreos de la web. DALL·E se entrenó en secuencias que eran una combinación de palabras y píxeles; no sabemos cuál era el conjunto de datos, pero probablemente uno realmente enorme.

Blackview Tab, la familia de tablets perfectas para todo

¿No es solo sobreajustar los datos de entrenamiento?

Es legítimo preguntarse si los resultados son simplemente de alta calidad porque han sido copiados o memorizados del material original.

Para probar sus habilidades, los investigadores forzaron a DALL·E a mostrar algunas indicaciones bastante inusuales, como “una ilustración profesional de alta calidad de una tortuga jirafa”.

Es difícil imaginar que el modelo se encontró con muchos híbridos de jirafas y tortugas en su conjunto de datos de entrenamiento, lo que hace que los resultados sean impresionantemente similares a una jirafa.

Curso de Elementos de IA GRATIS impartido por la Universidad de Helsinki

¿Cuáles son el resto de habilidades de visión de DALL-E?

DALL-E de OpenAI fue entrenado para generar imágenes a partir de subtítulos pero con el mensaje de texto correcto, se puede explorar un conjunto diverso de capacidades, incluidas la creación de versiones antropomórficas de animales y objetos.

Con la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes; se pueden llegar a encontrar resultados realmente creativos e impresionantes.

Esta es la primera vez que una máquina ha podido realizar tareas para las que no estaba específicamente entrenada puesto que el modelo ha logrado ir más lejos de generar representaciones banales de las imágenes.

Logrando usar toda su “inteligencia” para poder transmitir a las imágenes que genera diferentes ambientes e incluso estilos artísticas asociados a ciertos pintores muy concretos.

¿Cómo aprender aprendizaje automático o machine learning?

Algunos ámbitos creativos inteligentes de Dall E

A base de jugar y realizar infinidad de pruebas con el modelo, ya existen millones de ejemplos por internet con lo que Dall E ha logrado a crear.

Bien, dicho esto, citemos algunos ejemplos muy básicos pero no por ello menos sorprendentes, en los que Dall E ha logrado destacar devolviendo algunos resultados asombrosos.

  • Pasar imágenes a bocetos.
  • Representar textos creados como letreros en la calle o en una señal impresos.
  • Crear imágenes capaces de representar variables de posicionamiento con objetos concretos (crear un caballo debajo de una manzana o similares). Demostrando así, el entendimiento de la capacidad del espacio desde un texto.
  • Conocimiento geográfico. Es capaz de generar imágenes sobre objetos específicos (imaginarios) a un sitio o lugar del planeta; o bien, asociados a una cultura concreta.
  • Es capaz de genera imágenes con un diseño similar al de un período de tiempo indicado.

Mejores Cursos Gratis de Inteligencia Artificial (Machine Learning y Deep Learning)

¿DALL-E es una Inteligencia General?

Por supuesto, pero no se debe de confundir con la inteligencia ampliada. No es difícil engañar a estos modelos para que parezcan estúpidos.

Por ejemplo, el invertir los colores es una prueba demasiado compleja para un sistema como DALL-E, mientras que no debería representar una dificultad adicional para un ser humano.

Mejores CURSOS para Aprender GRATIS sobre Tecnología Online

¿Puedo probar DALL-E?

DALL-E de Open AI se encuentra disponible desde muchos lugares diferentes.

Entre ellos, la propia página de Open AI, pero también puedes probarlo desde otros muchos sitios web.

Por ejemplo, desde la página de CrAIyon o el estudio de NightCafé.

Debes tener en cuenta de que Open AI permite probar sus proyectos, pero te dan ciertos créditos de uso mensuales; una vez estos se terminen, debes pasar a un plan de pago o esperar al siguiente mes.

Artículos Relacionados
AWS invierte 100 millones de dólares de IA generativa

En un emocionante giro de los acontecimientos para la industria de la IA, la unidad de nube de Amazon, Amazon Web Services (AWS), ha anunciado su compromiso de 100 millones de dólares para establecer un centro dedicado a la inteligencia artificial generativa. Este movimiento ¡SEGUIR LEYENDO!

7 Habilidades humanas que la Inteligencia Artificial será incapaz de Sustituir

La Inteligencia artificial está ganando terreno de manera constante pero segura en nuestra vida diaria. Según un estudio, se prevé que esta última tecnología se haga cargo de la mayor parte del trabajo humano para 2025. https://ciberninjas.com/guias-aws-ia-aprendizaje-automatico-datos/ Pero existen ciertos trabajos y habilidades que ¡SEGUIR LEYENDO!

Open AI, comienza a usar PyTorch como framework principal

Se esta trabajando en estandarizar el framework de aprendizaje profundo de OpenAI en PyTorch. En el pasado, desde Open AI se trabajo en proyectos de muchos otros frameworks dependiendo de sus diferentes fortalezas. Ahora hemos optado por estandarizar el software utilizado para facilitar al ¡SEGUIR LEYENDO!