¿Qué es DALL-E de OpenAI? y ¿Por qué puede ser importante?

Vamos a hablar sobre una destreza de Inteligencia Artificial que ha estado mucho tiempo en las noticias: DALL-E de OpenAI. El modelo de aprendizaje capaz de generar imágenes muy precisas respecto a un texto creado por un ser humano.

¿Qué es Open AI? La empresa creadora de Chat GPT

Dall-E es un auténtico artista automático basado en la inteligencia artificial y por ello, le han dado el nombre en honor al reconocido pintor Dalí y el robot Wall-E de Pixar.

¿Qué es DALL-E?

Entonces, ¿Qué es DALL·E? En julio de este año, GPT-3 de OpenAI pudo generar artículos de opinión, poemas, sonetos y código informático.

DALL·E es una versión de 12 mil millones de parámetros del modelo GPT-3 Transformer que interpreta entradas de lenguaje natural (como por ejemplo “un bolso de cuero verde con forma de pentágono”) dada por un ser humano, y se encarga de generar las imágenes correspondientes.

DALL·E de OpenAI puede generar un gran conjunto de imágenes a partir de solamente eso, trazas de palabras. Luego, las imágenes se clasifican según un segundo modelo de OpenAI.

Este es denominado CLIP, e intenta determinar qué imagen coincide mejor con las imágenes más comunes sobre temas relacionados a los buscados; ejecutando así, una completa tarea como editor de fotos.

¿Qué es Chat GPT? ¿Cómo usarlo? Todo lo que necesitas saber sobre el bot impulsado por IA

¿Cómo fue construido Dall E?

Dall E utiliza la misma arquitectura de red neuronal que es responsable de toneladas de avances recientes en Machine Learning: El Transformador.

Los transformadores son un tipo de red neuronal fácil de paralelizar que se puede ampliar y entrenar en grandes conjuntos de datos. Han sido particularmente revolucionarios en el procesamiento del lenguaje natural, mejorando la calidad de los resultados de la Búsqueda de Google y la traducción.

La mayoría de estos grandes modelos de lenguaje están entrenados en enormes conjuntos de datos de texto como Wikipedia o rastreos de la web. DALL·E se entrenó en secuencias que eran una combinación de palabras y píxeles; no sabemos cuál era el conjunto de datos, pero probablemente uno realmente enorme.

Blackview Tab, la familia de tablets perfectas para todo

¿No es solo sobreajustar los datos de entrenamiento?

Es legítimo preguntarse si los resultados son simplemente de alta calidad porque han sido copiados o memorizados del material original.

Para probar sus habilidades, los investigadores forzaron a DALL·E a mostrar algunas indicaciones bastante inusuales, como “una ilustración profesional de alta calidad de una tortuga jirafa”.

Es difícil imaginar que el modelo se encontró con muchos híbridos de jirafas y tortugas en su conjunto de datos de entrenamiento, lo que hace que los resultados sean impresionantemente similares a una jirafa.

Curso de Elementos de IA GRATIS impartido por la Universidad de Helsinki

¿Cuáles son el resto de habilidades de visión de DALL-E?

DALL-E de OpenAI fue entrenado para generar imágenes a partir de subtítulos pero con el mensaje de texto correcto, se puede explorar un conjunto diverso de capacidades, incluidas la creación de versiones antropomórficas de animales y objetos.

Con la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes; se pueden llegar a encontrar resultados realmente creativos e impresionantes.

Esta es la primera vez que una máquina ha podido realizar tareas para las que no estaba específicamente entrenada puesto que el modelo ha logrado ir más lejos de generar representaciones banales de las imágenes.

Logrando usar toda su “inteligencia” para poder transmitir a las imágenes que genera diferentes ambientes e incluso estilos artísticas asociados a ciertos pintores muy concretos.

¿Cómo aprender aprendizaje automático o machine learning?

Algunos ámbitos creativos inteligentes de Dall E

A base de jugar y realizar infinidad de pruebas con el modelo, ya existen millones de ejemplos por internet con lo que Dall E ha logrado a crear.

Bien, dicho esto, citemos algunos ejemplos muy básicos pero no por ello menos sorprendentes, en los que Dall E ha logrado destacar devolviendo algunos resultados asombrosos.

  • Pasar imágenes a bocetos.
  • Representar textos creados como letreros en la calle o en una señal impresos.
  • Crear imágenes capaces de representar variables de posicionamiento con objetos concretos (crear un caballo debajo de una manzana o similares). Demostrando así, el entendimiento de la capacidad del espacio desde un texto.
  • Conocimiento geográfico. Es capaz de generar imágenes sobre objetos específicos (imaginarios) a un sitio o lugar del planeta; o bien, asociados a una cultura concreta.
  • Es capaz de genera imágenes con un diseño similar al de un período de tiempo indicado.

Mejores Cursos Gratis de Inteligencia Artificial (Machine Learning y Deep Learning)

¿DALL-E es una Inteligencia General?

Por supuesto, pero no se debe de confundir con la inteligencia ampliada. No es difícil engañar a estos modelos para que parezcan estúpidos.

Por ejemplo, el invertir los colores es una prueba demasiado compleja para un sistema como DALL-E, mientras que no debería representar una dificultad adicional para un ser humano.

Mejores CURSOS para Aprender GRATIS sobre Tecnología Online

¿Puedo probar DALL-E?

DALL-E de Open AI se encuentra disponible desde muchos lugares diferentes.

Entre ellos, la propia página de Open AI, pero también puedes probarlo desde otros muchos sitios web.

Por ejemplo, desde la página de CrAIyon o el estudio de NightCafé.

Debes tener en cuenta de que Open AI permite probar sus proyectos, pero te dan ciertos créditos de uso mensuales; una vez estos se terminen, debes pasar a un plan de pago o esperar al siguiente mes.

Relacionado

Bing IA y DALL-E 3 revolucionan la Creación de Imágenes: Una Inmersión Profunda en las Fotografías Realistas Generadas por IA

En un movimiento innovador, Bing AI se ha integrado con DALL-E 3, el último y más avanzado modelo de texto a imagen de OpenAI, para producir imágenes que son más realistas que nunca. Esta colaboración no solo mejora las capacidades de Image Creator de Bing, sino que también establece un nuevo estándar en el ámbito de las imágenes generadas por IA. Bing y DALL-E 3 Revolucionan ¡SEGUIR LEYENDO!

¿Qué es Chat GPT? ¿Cómo usarlo? Todo lo que necesitas saber sobre el bot impulsado por IA

El bot ChatGPT impulsado por IA tomó Internet este miércoles, cuando la compañía de investigación de Inteligencia Artificial (IA) OpenAI anunció el prototipo de chatbot de IA. ChatGPT se basa en un modelo de tecnología basada GPT-3.5 de la empresa que utiliza el aprendizaje profundo para entablar conversaciones similares a las humanas, comprender el lenguaje natural y responder en lenguaje natural. ¿Por qué se habla tanto ¡SEGUIR LEYENDO!

5 Tecnologías Principales Competidoras de ChatGPT

No es de extrañar que tengamos competidores del Chat GPT, el chat favorito de Internet. Vamos a intentar encontrar los competidores y alternativas que vendrán para poder superar a ChatGPT. Tecnologías alternativas a ChatGPT Esto es lo que he encontrado sobre el futuro de los modelos de IA que vendrán cada vez más pronto. 1. PALM PaLM superó el rendimiento de modelos como GPT-3. Ante el ¡SEGUIR LEYENDO!

ChatGPT ahora se Permite Usar sin Registrarse en OpenAI

Si ya has empezado a utilizar el chatbot de IA de ChatGPT, sabrás que se requiere una cuenta de OpenAI para aprovechar sus funciones. Esto no es inusual, ya que muchas empresas con productos y servicios de IA a menudo requieren algún pago por el acceso. Sin embargo, ahora que la IA se está utilizando más ampliamente, parece que OpenAI está dispuesta a hacer un ligero ¡SEGUIR LEYENDO!

¿Cómo generar Imágenes AI con la Búsqueda de Google (SGE)?

Google Bard es sin duda uno de los mejores chatbots con IA del mercado. Entre el procesamiento de lenguaje natural de última generación, impulsado por su nuevo modelo de inteligencia artificial llamado Gemini y la multimodalidad que rivaliza con ChatGPT de OpenAI, Google está abriendo nuevos caminos. La multimodalidad es la palabra del día, y ahora es posible la generación de imágenes mediante IA generativa dentro ¡SEGUIR LEYENDO!

CTO de OpenAI dice Sabe si Sora está Entrenada con Vídeos de YouTube

OpenAI no debería utilizar vídeos de YouTube para entrenar sus herramientas de inteligencia artificial , afirma el director ejecutivo de YouTube. ¿Pero es? La directora de tecnología de OpenAI, Mira Murati, dijo que no lo sabe. En una entrevista con The Wall Street Journal el mes pasado, se le preguntó a Murati si Sora, el generador de texto a video de OpenAI, estaba entrenado en contenido ¡SEGUIR LEYENDO!

Ex-empleado acusa a Google de entrenar a Bard con los datos de ChatGPT

Dado que el debut del chatbot Google Bard no fue demasiado impresionante, han aparecido informaciones de que la compañía estaba haciendo todo lo posible para cambiar la situación en el mercado de IA a su favor. https://ciberninjas.com/lanzado-google-bard/ A veces esto se hace de manera poco ética, o al menos eso es lo que dice uno de los ex-empleados de Google. Acusando a Google de haber entrenado ¡SEGUIR LEYENDO!

Salir de la versión móvil