¿Es GPT-4 realmente un salto hacia adelante para lograr AGI?

Microsoft publicó recientemente un artículo de investigación titulado: Sparks of Artificial General Intelligence: Early experiments with GPT-4.

Aquí tienes como lo describe Microsoft:

En este documento, hay evidencias concluyente que demuestran que GPT-4 va mucho más allá de la memorización y que tiene una comprensión profunda y flexible de conceptos, habilidades y dominios. De hecho, la capacidad para generalizar supera con creces la de cualquier ser humano vivo en la actualidad.

Si bien, hemos discutido anteriormente los beneficios de AGI , debemos resumir rápidamente el consenso general de lo que es un sistema AGI.

En esencia, un AGI es un tipo de IA avanzada que puede generalizarse en múltiples dominios y no tiene un alcance limitado. Los ejemplos de IA estrecha incluyen a un vehículo autónomo, un chatbot, un bot de ajedrez o cualquier otra IA que esté diseñada para un solo propósito.

En comparación, un AGI podría alternar de manera flexible entre cualquiera de los anteriores o cualquier otro campo de especialización.

Es una IA que aprovecharía los algoritmos incipientes, como el aprendizaje por transferencia y el aprendizaje evolutivo, al mismo tiempo que explota algoritmos heredados, como el aprendizaje por refuerzo profundo.

La descripción anterior de AGI coincide con mi experiencia personal con el uso de GPT-4, así como con la evidencia compartida en un trabajo de investigación publicado por Microsoft.

Una de las indicaciones descritas en el documento es que GPT-4 escriba una prueba de la infinidad de números primos en forma de poema.

Si analizamos los requisitos para crear un poema de este tipo, nos damos cuenta de que requiere razonamiento matemático, expresión poética y generación de lenguaje natural. Este es un desafío que excedería la capacidad promedio de la mayoría de los humanos.

El documento quería entender si GPT-4 simplemente produce contenido basado en la memorización general versus la comprensión del contexto y la capacidad de razonar. Cuando se le pide que recree un poema al estilo de Shakespeare, pudo hacerlo.

Esto requiere un nivel multifacético de comprensión que supera con creces la capacidad de la población general e incluye teoría de la mente e ingenio matemático.

¿Cómo calcular la inteligencia de GPT-4?

La pregunta entonces es, ¿Cómo podemos medir la inteligencia de un LLM? ¿GPT-4 muestra comportamientos de verdadero aprendizaje o mera memorización?

La forma actual de probar un sistema de IA es evaluar el sistema en un conjunto de conjuntos de datos de referencia estándar y garantizar que sean independientes de los datos de entrenamiento y que cubran una variedad de tareas y dominios: Este tipo de prueba es casi imposible debido a la cantidad casi ilimitada de datos con los que se entrenó GPT-4.

Luego, el documento profundiza en el territorio de generar tareas y preguntas novedosas y difíciles que demuestran de manera convincente que GPT-4 va mucho más allá de la memorización y que tiene una comprensión profunda y flexible de conceptos, habilidades y dominios.

Cuando se trata de inteligencia, GPT-4 puede generar historias cortas, guiones e incluso puede calcular las fórmulas más complicadas.

GPT-4 también puede codificar a un nivel muy alto, tanto en términos de escritura de código a partir de instrucciones como de comprensión del código existente.

Con GPT-4 se puede manejar una amplia gama de tareas de codificación, desde desafíos de codificación hasta aplicaciones del mundo real, desde ensamblaje de bajo nivel hasta marcos de trabajo de alto nivel, desde estructuras de datos simples hasta programas complejos como juegos.

Al usar GPT-4 también se puede razonar sobre la ejecución del código, simular los efectos de las instrucciones y explicar los resultados en lenguaje natural. GPT-4 puede incluso ejecutar pseudocódigo,

Por último, GPT-4 puede ofrecer respuestas racionales a casi cualquier indicación dada. De hecho, su inteligencia es casi invencible en cuanto a su complejidad.

Limitaciones de GPT-4

Luego, el documento continúa describiendo cómo probaron las respuestas y comportamientos de GPT-4 para verificar su consistencia, coherencia y corrección, y para descubrir sus limitaciones y sesgos.

La limitación más evidente es su tendencia a alucinar. Aquí hay un ejemplo de una alucinación que se da en el documento donde GPT-4 confiaba en su respuesta, que era completamente falsa.

Parece que incluso GPT-4 entiende esta limitación actual con sus alucinaciones, ya que esta fue la respuesta que dio cuando se le pregunta qué es una alucinación GPT:

Una alucinación GPT se refiere a un fenómeno en el que un modelo de transformador preentrenado generativo (GPT), como con el que está interactuando actualmente, produce una respuesta que no se basa en información objetiva o no es coherente con el contexto proporcionado. Estas alucinaciones ocurren cuando el modelo genera un texto que puede parecer plausible pero que en realidad es incorrecto, engañoso o sin sentido.

En otras palabras, cuando entrena a una IA LLM en los datos del mundo, ¿Cómo evitar que un sistema aprenda datos incorrectos? Un gran modelo de lenguaje que aprende y regurgita información errónea y teorías de conspiración en realidad podría ser una de las mayores trampas y amenazas que enfrenta la humanidad con la adopción a gran escala de LLM.

En realidad, esta podría ser una de las mayores amenazas de AGI, una que sorprendentemente se pasa por alto cuando se analizan los peligros de AGI.

Pruebas de inteligencia GPT-4

El documento ilustra que no importaba qué tipo de indicaciones complejas se dirijan hacia él, GPT-4 superaría las expectativas. Como se indica en el documento:

Su incomparable dominio del lenguaje natural. No solo puede generar un texto fluido y coherente, sino también comprenderlo y manipularlo de varias maneras, como resumir, traducir o responder a un conjunto extremadamente amplio de preguntas.
Además, al traducir nos referimos no solo a diferentes idiomas naturales, sino también a traducciones en tono y estilo, así como a través de dominios como medicina, derecho, contabilidad, programación informática, música y más.

Se dieron revisiones técnicas simuladas a GPT-4 y fácilmente pasó el significado en este contexto como si se tratase de un humano en el otro extremo que serían contratados instantáneamente como ingenieros de software.

Una prueba preliminar similar de la competencia de GPT-4 en el examen de la barra multiestatal mostró una precisión superior al 70%. Esto significa que en el futuro podríamos automatizar muchas de las tareas que actualmente se le dan a los abogados.

De hecho, hay algunas startups que ya están trabajando para crear abogados robot usando GPT-4.

Produciendo nuevo conocimiento

Uno de los argumentos en el documento es que lo único que le queda a GPT-4 para demostrar niveles reales de comprensión es que produzca nuevos conocimientos, como probar nuevos teoremas matemáticos, una hazaña que actualmente permanece fuera del alcance de los LLM.

Por otra parte, este es el santo grial de un AGI. Si bien, existen peligros con el control de un AGI en las manos equivocadas, los beneficios de que un AGI pueda analizar rápidamente todos los datos históricos para descubrir nuevos teoremas, curas y tratamientos son casi infinitos.

Un AGI podría ser el eslabón perdido para encontrar curas para enfermedades genéticas raras que actualmente carecen de financiación de la industria privada, para curar el cáncer de una vez por todas y para maximizar la eficiencia de la energía renovable para eliminar nuestra dependencia de la energía insostenible.

De hecho, podría resolver cualquier problema consecuente que se introduzca en el sistema AGI. Esto es lo que entienden Sam Altman y el equipo de OpenAI, un AGI es verdaderamente el último invento que se necesita para resolver la mayoría de los problemas y beneficiar a la humanidad.

Por supuesto, eso no resuelve el problema del botón nuclear de quién controla el AGI y cuáles son sus intenciones.

Independientemente, este documento hace un trabajo fenomenal al argumentar que GPT-4 es un paso adelante para lograr el sueño que los investigadores de IA han tenido desde 195 , cuando se lanzó por primera vez el taller de verano del Proyecto de Investigación de Verano de Dartmouth sobre la Inteligencia Artificial.

Si bien es discutible si GPT-4 es un AGI, se podría argumentar fácilmente que por primera vez en la historia de la humanidad, es un sistema de IA capaz de superar la prueba de Turing.

Relacionado

CEO de OpenAI dice que la gente se sentirá decepcionada con GPT-4

Sam Altman, director ejecutivo de la empresa de tecnología estrella en ascenso OpenAI, dice que las personas se están preparando para la decepción en términos de las capacidades de GPT-4. En una entrevista reciente, Altman respondió preguntas sobre el nuevo modelo de lenguaje y explicó por ¡SEGUIR LEYENDO!

¿Qué diferencias hay entre ChatGPT y GPT?

ChatGPT y GPT-4 son temas muy buscados en las últimas fechas. Gracias a que este chat impulsado por IA es capaz de lograr una conversación asombrosamente similar a la humana e incluso mucho más. En caso de que no estés familiarizado con esta tecnología, estos "chatbots" ¡SEGUIR LEYENDO!

¡GPT-4 llegará la próxima semana! ¿Será capaz de resolver el problema de ChatGPT?

El Chat GPT-4 llegará muyp ronto y podría resolver algunos de los problemas de ChatGPT, gracias a sus nuevas capacidades.` Actualmente, ChatGPT y otras tecnologías impulsadas por GPT-3.5 solo pueden proporcionar respuestas basadas en texto. Además de sus capacidades multimodales, GPT-4 también podría resolver el lento ¡SEGUIR LEYENDO!

6 Agentes de IA Autónomos que Deberías Conocer

En los últimos meses, ha habido un aumento significativo en el trabajo de investigación relacionado con agentes autónomos de IA, particularmente en el contexto de grandes modelos de lenguaje (LLM), cambiando la forma en que uno interactúa con Internet o la web. Mucho de estos, ya ¡SEGUIR LEYENDO!

GPT 4 Disponible para Todos en la IA de Bing

Fue hace aproximadamente un mes cuando Microsoft lanzó el nuevo Bing impulsado por IA para aprovechar el bombo publicitario de ChatGPT. Respaldado por lo que ahora conocemos como GPT-4, el motor de búsqueda y chatbot impulsado por IA se hizo extremadamente popular (~ 100 millones de ¡SEGUIR LEYENDO!