Grok, el chatbot de IA de xAI de Elon Musk, ha estado en acceso temprano desde el 4 de noviembre de 2023. Con el acceso público ahora implementado en todo EE. UU. para los suscriptores de X Premium+, sus capacidades se pondrán a prueba contra rivales clave de la gran tecnología.
Uno de esos competidores es Copilot (anteriormente Bing Chat), el chatbot de inteligencia artificial de Microsoft impulsado por GPT-4 de OpenAI.
Ambas herramientas de IA cuentan con poderosas capacidades de IA generativa a partir de sus modelos de lenguaje grande (LLM) patentados. Sin embargo, lo más importante es que Elon Musk le dio a xAI solo dos meses para entrenar a Grok, lo que significa que Microsoft Copilot es más maduro tanto en el sentido técnico como en el mercado de asistentes de IA.
¿Podrá xAI ponerse al día? Comparemos Grok AI con Bing Chat.
Grok AI frente a Microsoft Copilot (anteriormente Bing Chat)
¡Entre Grok AI vs Copilot, Microsoft sale victorioso! Impulsada por GPT-4, el modelo de lenguaje grande (LLM) más poderoso de OpenAI, la única y gratuita versión de Bing Chat supera objetivamente a Grok-1 en cuatro puntos de referencia independientes.
Además, Copilot se beneficia del acceso a Internet a través del propio motor de búsqueda de Microsoft, Bing. Esto le da acceso a datos e información en tiempo real de eventos actuales que ni siquiera ChatGPT tenía hasta hace muy poco.
Además de todo eso, Copilot tiene integración con DALL·E 3, conocido como Bing Image Creator, que permite la generación de imágenes y la salida de archivos de imágenes desde la comodidad de la interfaz ‘Bing Chat’. Si puedes describir una imagen, ¡el “nuevo Bing” (o realmente DALL·E 3, crédito a quien corresponde) puede hacerlo!
La herramienta Grok AI es diferente de Copilot, o de cualquier otro chatbot insignia conocido, en personalidad. Las indicaciones serán respondidas con más humor, sarcasmo e incluso descaro que Copilot, blandiendo una “veta rebelde” a diferencia de los otros sistemas de inteligencia artificial que conocemos y amamos (?).
Cualquiera de estos chatbots comprende modelos de IA competentes. La distinción más importante entre ambas plataformas, en este momento, es la accesibilidad. Con Grok AI escondido detrás de una lista de espera, ¡no importa qué tan bueno sea el asistente de inteligencia artificial de Elon Musk hasta que puedas usarlo!
Comparación de características y puntos de referencia de AI Chatbot
Cada uno de los siguientes puntos de referencia registra la velocidad y/o precisión de un LLM al realizar una tarea determinada.
GSM8k se basa en “problemas planteados de matemáticas de la escuela secundaria”, que son bastante fáciles para un humano, pero no tanto para una máquina. Por supuesto, una calculadora obtendría una puntuación del 100% en este tipo de problemas, pero un LLM no es una calculadora.
De hecho, una red neuronal no utiliza inherentemente ninguna aritmética y, en cambio, “resuelve” estos problemas de una manera mucho más humana que una calculadora.
MMLU (Comprensión masiva del lenguaje multitarea) se centra en preguntas multidisciplinarias de opción múltiple.
HumanEval es una prueba diseñada para la aptitud en programación (específicamente Python, pero la resolución de problemas involucrada se traduce bien a otros lenguajes de programación).
MATEMÁTICAS implica “problemas matemáticos de secundaria y preparatoria”. Ligeramente más avanzado para los humanos, pero demostrablemente más difícil para los sistemas de procesamiento del lenguaje natural (PNL).
Punto de referencia | Grok-0 | Llama 2 | Inflexión-1 | GPT-3.5 | Grok-1 | Palma 2 | claude-2 | GPT-4 |
---|---|---|---|---|---|---|---|---|
GSM8k | 56,8% | 56,8% | 62,9% | 57,1% | 62,9% | 80,7% | 88% | 92% |
MMLU | 65,7% | 68,9% | 72,7% | 70,0% | 73,0% | 78% | 75% | 86,4% |
evaluación humana | 39,7% | 29,9% | 35,4% | 48,1% | 63,2% | N / A | 70% | 67% |
MATEMÁTICAS | 15,7% | 13,5% | 16,0% | 23,5% | 23,9% | 34,6% | N / A | 42,5% |
Los grandes modelos de lenguaje de las grandes tecnologías, evaluados por xAI.
xAI vs Microsoft: comparación de chatbots de IA
Otra forma de comparar todos estos chatbots de IA de arriba hacia abajo es poner todos los nombres uno al lado del otro. Ya existe suficiente confusión sobre la distinción entre chatbots y modelos de lenguaje que se volverá más confusa con cada nuevo lanzamiento. ¡Esperamos que esta pequeña y sencilla mesa te resulte útil en ese sentido!
Compañía | CEO | Chatbot de IA | LLM | API | Fuente abierta |
---|---|---|---|---|---|
xAI | Elon Musk | Grok | Grok-1 | No | No |
Abierto AI | Sam Altman | ChatGPT | GPT-3.5, GPT-4, GPT-4V o GPT-4 Turbo | Sí | No |
Sundar Pichai | Bard | Palma 2 | Sí | No | |
microsoft | Nadella Satay | Copiloto (anteriormente Bing Chat) | GPT-4 | No | No |
Meta | Mark Zuckerberg | Meta IA | Llama 2 | No | Sí |
antrópico | Dario Amodei | claudio | claude-2 | Sí | No |
Amazonas | Andy Jassy | Olimpo (se rumorea) | Olimpo (se rumorea) | No | No |
Los chatbots de IA de las grandes tecnologías.
Se puede acceder a algunos de los chatbots anteriores a través de un sitio web basado en navegador, como Google Bard. A otros se puede acceder a través de una aplicación móvil, como ‘Bing Chat’ (ahora Copilot). A otros todavía se puede acceder a ellos tanto de las formas anteriores como a través de una API, como ChatGPT.
Sin embargo, en el lado restrictivo tenemos Meta AI, a la que solo se puede acceder a través de aplicaciones existentes que no son nativas de AI. Actualmente, solo se puede acceder a Meta AI a través de las aplicaciones de redes sociales Instagram, WhatsApp y Facebook Messenger.
Esto nos lleva a Grok, el más restringido de todos con acceso limitado a un programa de acceso anticipado de suscriptores de X Premium+, actualmente limitado a EE.UU. Con el nuevo año a la vuelta de la esquina, es probable que Grok-2 se convierta en uno de los tres mejores robots de IA en 2024.