En los últimos meses, ha habido un aumento significativo en el trabajo de investigación relacionado con agentes autónomos de IA, particularmente en el contexto de grandes modelos de lenguaje (LLM), cambiando la forma en que uno interactúa con Internet o la web.
Mucho de estos, ya son capaces de transformar el envío de correos electrónicos, negociar, fabricar productos, comprar, cumplir pedidos o incluso reservar boletos de avión u incluso cómo se construirán los LLM en un futuro próximo.
Actualmente, los LLM dependen de la guía humana y carecen de razonamiento autónomo, mientras que los agentes autónomos pueden operar de forma independiente, tomando decisiones en tiempo real y adaptándose a escenarios cambiantes.
Una aplicación interesante de los agentes autónomos es su capacidad para mejorar el desempeño de los LLM. Colaboran en conversaciones entre múltiples agentes, lo que permite a los LLM mejorar mediante comentarios e intercambio de razonamiento.
Microsoft creó recientemente AutoGen , un marco que permite crear aplicaciones LLM utilizando múltiples agentes que podrían comunicarse entre sí.
De manera similar, Google DeepMind publicó recientemente un artículo “¿Cuán lejos son los modelos de lenguaje grandes de agentes con teoría de la mente?” Incluso Meta’s Shepherd: A Critic for Language Model Generation habla de los mismos agentes autónomos de IA que aumentan y realizan tareas todo por ellos mismos.
OpenAI también se está preparando para lanzar algo similar el próximo mes en DevDay, que se promocionará como JARVIS.
6 Agentes de Inteligencia Artificial que como Desarrollador deberías Conocer
Aquí tienes una lista de los agentes autónomos de IA más recientes.
1. Autogen
El agente AutoGen de Microsoft, por ejemplo, aprovecha los LLM para crear agentes versátiles capaces de aprender, adaptarse e incluso codificar.
Esta fusión de capacidades, junto con características como el almacenamiento en caché y la intervención humana, permite que los sistemas de IA evolucionen y prosperen.
AutoGen simplifica la creación de aplicaciones LLM de próxima generación, automatizando y optimizando flujos de trabajo complejos. Este agente de IA admite diversos patrones de conversación y los desarrolladores pueden personalizar las interacciones de los agentes.
Ofrece una variedad de sistemas de trabajo para diferentes aplicaciones y puede reemplazar las herramientas de OpenAI para API de inferencia mejorada.
2. MusicAgent
Los investigadores de Microsoft presentaron recientemente MusicAgent, un agente autónomo basado en un LLM en el ámbito de la música.
Se dice que este agente de IA ayuda a los desarrolladores a analizar automáticamente las solicitudes de los usuarios y seleccionar las herramientas adecuadas como soluciones.
Su nuevo marco integra directamente numerosas herramientas relacionadas con la música de diversas fuentes, incluidas Hugging Face, GitHub, búsqueda web, etc.
Además de esto, los investigadores también han adaptado el flujo de trabajo autónomo para permitir una mejor compatibilidad en tareas musicales, permitiendo a los usuarios ampliar su conjunto de herramientas. Busca integrar más funciones relacionadas con la música en MusicAgent.
3. MiniAGI
El agente de MiniAGI es un agente autónomo sencillo que funciona a la perfección con GPT-3.5-Turbo y GPT-4.
Utiliza un mensaje sólido junto con un conjunto de herramientas mínimo, una cadena de pensamientos y una memoria a corto plazo que incorpora resúmenes. Además, tiene capacidad de monólogo interior y autocrítica.
4. Multi GPT
El agente Multi-GPT es un sistema experimental de múltiples agentes que presenta “GPT expertos” que colaboran para realizar tareas.
Cada expertoGPT posee memoria individual a corto y largo plazo y la capacidad de comunicarse con otros. Los usuarios pueden asignar tareas y los expertos GPT trabajarán juntos para completarlas.
El sistema ofrece acceso a Internet para la recopilación y búsqueda de información. Gestiona eficientemente la memoria a corto y largo plazo.
Utiliza instancias GPT-4 para la generación de texto, proporciona acceso a plataformas y sitios web populares e incluye almacenamiento y resumen de archivos mediante GPT-3.5. Esto convierte a Multi-GPT en una herramienta versátil para diversas tareas y necesidades de gestión de datos.
5. BeeBot
El agente de BeeBot es un asistente de IA autónomo diseñado para optimizar y automatizar una amplia gama de tareas prácticas.
Con BeeBot, los usuarios pueden experimentar la comodidad de seleccionar herramientas a través de AutoPack, ofreciendo la flexibilidad de adquirir herramientas adicionales a medida que evolucionan las tareas.
Además, la inclusión de persistencia incorporada garantiza que BeeBot pueda recordar y recuperar información, lo que lo convierte en un asistente aún más confiable.
Puede trabajar fácilmente con diferentes sistemas y servicios gracias a su API REST, que sigue un estándar común llamado e2b. BeeBot también lo mantiene informado mediante el uso de un servidor websocket para compartir actualizaciones en tiempo real. Es adaptable a diferentes formas de almacenar archivos, como en la memoria, en su computadora o en una base de datos.
6. Baby AGI
El agente Baby AGI, un script de Python, agiliza la gestión de tareas mediante el uso de las API OpenAI y Pinecone junto con el marco LangChain. Este sistema impulsado por IA sobresale en la creación, organización, priorización y ejecución de tareas basadas en objetivos predefinidos, todo aprendido de tareas anteriores.
Baby AGI aprovecha las capacidades de procesamiento del lenguaje natural (NLP) de OpenAI para diseñar nuevas tareas que se alineen con los objetivos establecidos. Pinecone sirve como depósito para almacenar los resultados de las tareas y recuperar el contexto, mientras que el marco LangChain se encarga de la toma de decisiones.