¿Qué es DALL-E de OpenAI? y ¿Por qué puede ser importante?

Vamos a hablar sobre una destreza de Inteligencia Artificial que ha estado mucho tiempo en las noticias: DALL-E de OpenAI. El modelo de aprendizaje capaz de generar imágenes muy precisas respecto a un texto creado por un ser humano.

¿Qué es Open AI? La empresa creadora de Chat GPT

Dall-E es un auténtico artista automático basado en la inteligencia artificial y por ello, le han dado el nombre en honor al reconocido pintor Dalí y el robot Wall-E de Pixar.

¿Qué es DALL-E?

Entonces, ¿Qué es DALL·E? En julio de este año, GPT-3 de OpenAI pudo generar artículos de opinión, poemas, sonetos y código informático.

DALL·E es una versión de 12 mil millones de parámetros del modelo GPT-3 Transformer que interpreta entradas de lenguaje natural (como por ejemplo “un bolso de cuero verde con forma de pentágono”) dada por un ser humano, y se encarga de generar las imágenes correspondientes.

DALL·E de OpenAI puede generar un gran conjunto de imágenes a partir de solamente eso, trazas de palabras. Luego, las imágenes se clasifican según un segundo modelo de OpenAI.

Este es denominado CLIP, e intenta determinar qué imagen coincide mejor con las imágenes más comunes sobre temas relacionados a los buscados; ejecutando así, una completa tarea como editor de fotos.

¿Qué es Chat GPT? ¿Cómo usarlo? Todo lo que necesitas saber sobre el bot impulsado por IA

¿Cómo fue construido Dall E?

Dall E utiliza la misma arquitectura de red neuronal que es responsable de toneladas de avances recientes en Machine Learning: El Transformador.

Los transformadores son un tipo de red neuronal fácil de paralelizar que se puede ampliar y entrenar en grandes conjuntos de datos. Han sido particularmente revolucionarios en el procesamiento del lenguaje natural, mejorando la calidad de los resultados de la Búsqueda de Google y la traducción.

La mayoría de estos grandes modelos de lenguaje están entrenados en enormes conjuntos de datos de texto como Wikipedia o rastreos de la web. DALL·E se entrenó en secuencias que eran una combinación de palabras y píxeles; no sabemos cuál era el conjunto de datos, pero probablemente uno realmente enorme.

Blackview Tab, la familia de tablets perfectas para todo

¿No es solo sobreajustar los datos de entrenamiento?

Es legítimo preguntarse si los resultados son simplemente de alta calidad porque han sido copiados o memorizados del material original.

Para probar sus habilidades, los investigadores forzaron a DALL·E a mostrar algunas indicaciones bastante inusuales, como “una ilustración profesional de alta calidad de una tortuga jirafa”.

Es difícil imaginar que el modelo se encontró con muchos híbridos de jirafas y tortugas en su conjunto de datos de entrenamiento, lo que hace que los resultados sean impresionantemente similares a una jirafa.

Curso de Elementos de IA GRATIS impartido por la Universidad de Helsinki

¿Cuáles son el resto de habilidades de visión de DALL-E?

DALL-E de OpenAI fue entrenado para generar imágenes a partir de subtítulos pero con el mensaje de texto correcto, se puede explorar un conjunto diverso de capacidades, incluidas la creación de versiones antropomórficas de animales y objetos.

Con la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes; se pueden llegar a encontrar resultados realmente creativos e impresionantes.

Esta es la primera vez que una máquina ha podido realizar tareas para las que no estaba específicamente entrenada puesto que el modelo ha logrado ir más lejos de generar representaciones banales de las imágenes.

Logrando usar toda su “inteligencia” para poder transmitir a las imágenes que genera diferentes ambientes e incluso estilos artísticas asociados a ciertos pintores muy concretos.

¿Cómo aprender aprendizaje automático o machine learning?

Algunos ámbitos creativos inteligentes de Dall E

A base de jugar y realizar infinidad de pruebas con el modelo, ya existen millones de ejemplos por internet con lo que Dall E ha logrado a crear.

Bien, dicho esto, citemos algunos ejemplos muy básicos pero no por ello menos sorprendentes, en los que Dall E ha logrado destacar devolviendo algunos resultados asombrosos.

  • Pasar imágenes a bocetos.
  • Representar textos creados como letreros en la calle o en una señal impresos.
  • Crear imágenes capaces de representar variables de posicionamiento con objetos concretos (crear un caballo debajo de una manzana o similares). Demostrando así, el entendimiento de la capacidad del espacio desde un texto.
  • Conocimiento geográfico. Es capaz de generar imágenes sobre objetos específicos (imaginarios) a un sitio o lugar del planeta; o bien, asociados a una cultura concreta.
  • Es capaz de genera imágenes con un diseño similar al de un período de tiempo indicado.

Mejores Cursos Gratis de Inteligencia Artificial (Machine Learning y Deep Learning)

¿DALL-E es una Inteligencia General?

Por supuesto, pero no se debe de confundir con la inteligencia ampliada. No es difícil engañar a estos modelos para que parezcan estúpidos.

Por ejemplo, el invertir los colores es una prueba demasiado compleja para un sistema como DALL-E, mientras que no debería representar una dificultad adicional para un ser humano.

Mejores CURSOS para Aprender GRATIS sobre Tecnología Online

¿Puedo probar DALL-E?

DALL-E de Open AI se encuentra disponible desde muchos lugares diferentes.

Entre ellos, la propia página de Open AI, pero también puedes probarlo desde otros muchos sitios web.

Por ejemplo, desde la página de CrAIyon o el estudio de NightCafé.

Debes tener en cuenta de que Open AI permite probar sus proyectos, pero te dan ciertos créditos de uso mensuales; una vez estos se terminen, debes pasar a un plan de pago o esperar al siguiente mes.

Artículos Relacionados
5 Mejores herramientas basadas en IA que ayudan en la redacción de contenido

De vuelta en su mente, si cree que la redacción de contenido es una tarea fácil, entonces probablemente esté pensando mal. La razón es que la redacción de contenido exige mucha lucha, una mente táctica y habilidades de escritura avanzadas. No era fácil antes, ¡SEGUIR LEYENDO!

Generador de Texto a través de IA: Modelado de Lenguaje a Gran Escala

Desde Open AI lanzan información sobre como avanza su proyecto de Lenguaje Mejorado. A groso modo, la historia trata de crear un generador de texto, que partiendo de una gran base de datos de textos recopilados a través de Internet, entre otros sitios de ¡SEGUIR LEYENDO!

¿Qué diferencias hay entre ChatGPT y GPT?

ChatGPT y GPT-4 son temas muy buscados en las últimas fechas. Gracias a que este chat impulsado por IA es capaz de lograr una conversación asombrosamente similar a la humana e incluso mucho más. En caso de que no estés familiarizado con esta tecnología, ¡SEGUIR LEYENDO!

El modelo de IA de OpenAI reconoce automáticamente el habla y la traduce al inglés

"Whisper" open source model may become a building block in future speech-to-text apps.

¿Cómo funcionan juntos el Internet de las Cosas y la Inteligencia Artificial?

La Inteligencia Artificial puede combinar los beneficios de IoT al agregar conciencia y toma de decisiones similares a las humanas en el entorno en cuestión para en última instancia, aumentar la eficiencia y mejorar los procesos. IoT y IA son dos de los temas ¡SEGUIR LEYENDO!

Flexciton utiliza la inteligencia artificial para ayudar a las fábricas a optimizar las líneas de producción

Flexciton se hace con un mayor presupuesto para la investigación en inteligencia artificial, Flexciton es una startup con sede en Londres que utiliza inteligencia artificial para ayudar a las fábricas a optimizar sus líneas de producción.

CEO de OpenAI dice que la gente se sentirá decepcionada con GPT-4

Sam Altman, director ejecutivo de la empresa de tecnología estrella en ascenso OpenAI, dice que las personas se están preparando para la decepción en términos de las capacidades de GPT-4. En una entrevista reciente, Altman respondió preguntas sobre el nuevo modelo de lenguaje y ¡SEGUIR LEYENDO!