¿Qué es DALL-E de OpenAI? y ¿Por qué puede ser importante?

Vamos a hablar sobre una destreza de Inteligencia Artificial que ha estado mucho tiempo en las noticias: DALL-E de OpenAI. El modelo de aprendizaje capaz de generar imágenes muy precisas respecto a un texto creado por un ser humano.

¿Qué es Open AI? La empresa creadora de Chat GPT

Dall-E es un auténtico artista automático basado en la inteligencia artificial y por ello, le han dado el nombre en honor al reconocido pintor Dalí y el robot Wall-E de Pixar.

¿Qué es DALL-E?

Entonces, ¿Qué es DALL·E? En julio de este año, GPT-3 de OpenAI pudo generar artículos de opinión, poemas, sonetos y código informático.

DALL·E es una versión de 12 mil millones de parámetros del modelo GPT-3 Transformer que interpreta entradas de lenguaje natural (como por ejemplo “un bolso de cuero verde con forma de pentágono”) dada por un ser humano, y se encarga de generar las imágenes correspondientes.

DALL·E de OpenAI puede generar un gran conjunto de imágenes a partir de solamente eso, trazas de palabras. Luego, las imágenes se clasifican según un segundo modelo de OpenAI.

Este es denominado CLIP, e intenta determinar qué imagen coincide mejor con las imágenes más comunes sobre temas relacionados a los buscados; ejecutando así, una completa tarea como editor de fotos.

¿Qué es Chat GPT? ¿Cómo usarlo? Todo lo que necesitas saber sobre el bot impulsado por IA

¿Cómo fue construido Dall E?

Dall E utiliza la misma arquitectura de red neuronal que es responsable de toneladas de avances recientes en Machine Learning: El Transformador.

Los transformadores son un tipo de red neuronal fácil de paralelizar que se puede ampliar y entrenar en grandes conjuntos de datos. Han sido particularmente revolucionarios en el procesamiento del lenguaje natural, mejorando la calidad de los resultados de la Búsqueda de Google y la traducción.

La mayoría de estos grandes modelos de lenguaje están entrenados en enormes conjuntos de datos de texto como Wikipedia o rastreos de la web. DALL·E se entrenó en secuencias que eran una combinación de palabras y píxeles; no sabemos cuál era el conjunto de datos, pero probablemente uno realmente enorme.

Blackview Tab, la familia de tablets perfectas para todo

¿No es solo sobreajustar los datos de entrenamiento?

Es legítimo preguntarse si los resultados son simplemente de alta calidad porque han sido copiados o memorizados del material original.

Para probar sus habilidades, los investigadores forzaron a DALL·E a mostrar algunas indicaciones bastante inusuales, como “una ilustración profesional de alta calidad de una tortuga jirafa”.

Es difícil imaginar que el modelo se encontró con muchos híbridos de jirafas y tortugas en su conjunto de datos de entrenamiento, lo que hace que los resultados sean impresionantemente similares a una jirafa.

Curso de Elementos de IA GRATIS impartido por la Universidad de Helsinki

¿Cuáles son el resto de habilidades de visión de DALL-E?

DALL-E de OpenAI fue entrenado para generar imágenes a partir de subtítulos pero con el mensaje de texto correcto, se puede explorar un conjunto diverso de capacidades, incluidas la creación de versiones antropomórficas de animales y objetos.

Con la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes; se pueden llegar a encontrar resultados realmente creativos e impresionantes.

Esta es la primera vez que una máquina ha podido realizar tareas para las que no estaba específicamente entrenada puesto que el modelo ha logrado ir más lejos de generar representaciones banales de las imágenes.

Logrando usar toda su “inteligencia” para poder transmitir a las imágenes que genera diferentes ambientes e incluso estilos artísticas asociados a ciertos pintores muy concretos.

¿Cómo aprender aprendizaje automático o machine learning?

Algunos ámbitos creativos inteligentes de Dall E

A base de jugar y realizar infinidad de pruebas con el modelo, ya existen millones de ejemplos por internet con lo que Dall E ha logrado a crear.

Bien, dicho esto, citemos algunos ejemplos muy básicos pero no por ello menos sorprendentes, en los que Dall E ha logrado destacar devolviendo algunos resultados asombrosos.

  • Pasar imágenes a bocetos.
  • Representar textos creados como letreros en la calle o en una señal impresos.
  • Crear imágenes capaces de representar variables de posicionamiento con objetos concretos (crear un caballo debajo de una manzana o similares). Demostrando así, el entendimiento de la capacidad del espacio desde un texto.
  • Conocimiento geográfico. Es capaz de generar imágenes sobre objetos específicos (imaginarios) a un sitio o lugar del planeta; o bien, asociados a una cultura concreta.
  • Es capaz de genera imágenes con un diseño similar al de un período de tiempo indicado.

Mejores Cursos Gratis de Inteligencia Artificial (Machine Learning y Deep Learning)

¿DALL-E es una Inteligencia General?

Por supuesto, pero no se debe de confundir con la inteligencia ampliada. No es difícil engañar a estos modelos para que parezcan estúpidos.

Por ejemplo, el invertir los colores es una prueba demasiado compleja para un sistema como DALL-E, mientras que no debería representar una dificultad adicional para un ser humano.

Mejores CURSOS para Aprender GRATIS sobre Tecnología Online

¿Puedo probar DALL-E?

DALL-E de Open AI se encuentra disponible desde muchos lugares diferentes.

Entre ellos, la propia página de Open AI, pero también puedes probarlo desde otros muchos sitios web.

Por ejemplo, desde la página de CrAIyon o el estudio de NightCafé.

Debes tener en cuenta de que Open AI permite probar sus proyectos, pero te dan ciertos créditos de uso mensuales; una vez estos se terminen, debes pasar a un plan de pago o esperar al siguiente mes.

Relacionado

Sam Altman tiene a Siri y Alexa en el Punto de Mira: OpenAI registra un asistente de voz digital

Sam Altman podría estar esforzándose por enfrentarse a los asistentes de voz Siri de Apple y Alex de Amazon. OpenAI ha presentado una solicitud de marca registrada para crear "asistentes de voz digitales" y un "motor de voz", lo que indica que es posible que esté listo para lanzar un nuevo producto. La solicitud se presentó ante la Oficina de Patentes y Marcas de EE. UU. ¡SEGUIR LEYENDO!

Sam Altman Descontento con OpenAI: Le cambiaría el nombre si pudiese viajar en el tiempo

Sam Altman sugirió que OpenAI tal vez no sea el nombre más ideal para la empresa de inteligencia artificial, al menos en retrospectiva. El director ejecutivo de OpenAI, de 38 años que cofundó la empresa junto con Elon Musk y otros en 2015, explicó en el podcast de Lex Fridman que cuando la empresa apenas comenzaba, no sabían muy bien cómo iba a ser. "Comenzamos pensando ¡SEGUIR LEYENDO!

OpenAI ya Integra la Red Neuronal DALLE 3 en ChatGPT

OpenAI presentó DALLE 3, una nueva generación de red neuronal para generar imágenes. Los desarrolladores afirman que esta versión maneja las mismas consultas mucho mejor en comparación con DALLE 2. https://youtu.be/sqQrN0iZBs0 Una de las características clave de la nueva versión es la integración de ChatGPT, también desarrollado por OpenAI, pero diseñado para trabajar con textos y no con imágenes. Basta con que el usuario explique en ¡SEGUIR LEYENDO!

OpenAI despide a Sam Altman, el hombre detrás de ChatGPT

Internet está a tope, las redes sociales están llenas de publicaciones sobre Sam Altman, el cerebro detrás de OpenAI y chatbots como ChatGPT y GPT-4, fue despedido abruptamente de OpenAI. Sam Altman de OpenAI despedido abruptamente Despedido por la junta directiva, la salida de Sam se confirmó después de que apareció una publicación en el blog de OpenAI y pronto, la publicación de Sam en X ¡SEGUIR LEYENDO!

OpenAI crea Misterioso Entrenamiento para Sora

La comunidad de IA supone que OpenAI utiliza grandes cantidades de vídeos de YouTube para entrenar modelos, incluida su nueva oferta Sora. Esto, es casi un secreto a voces a estas alturas. Aunque el mayor misterio es cómo OpenAI accede a suficiente contenido de YouTube para que esto funcione. YouTube de Google prohíbe la extracción de sus videos por parte de bots y otros métodos automatizados, ¡SEGUIR LEYENDO!