Sam Altman podría estar esforzándose por enfrentarse a los asistentes de voz Siri de Apple y Alex de Amazon.
OpenAI ha presentado una solicitud de marca registrada para crear “asistentes de voz digitales” y un “motor de voz”, lo que indica que es posible que esté listo para lanzar un nuevo producto.
La solicitud se presentó ante la Oficina de Patentes y Marcas de EE. UU. el martes, un día después de que se transmitiera una entrevista con Sam Altman en la que dijo que OpenAI tiene “muchas otras cosas importantes que publicar” antes de su próximo GPT-5.
Es posible que esas características no se materialicen, ya que las empresas a menudo presentan solicitudes de marcas para ideas que nunca ven la luz del día. Sin embargo, se espera que OpenAI lance una actualización “materialmente mejor” de su modelo ChatGPT a mediados de año, como informó anteriormente Business Insider .
En una entrevista con el podcaster Lex Fridman, Altman dijo: “Lanzaremos un nuevo modelo increíble este año. No sé cómo lo llamaremos. Lanzaremos en los próximos meses muchas cosas diferentes, creo que Será genial.”
Añadió: “Creo que antes de hablar de un modelo similar a GPT-5 llamado así o no llamado así o un poco peor o un poco mejor de lo que esperarías de un GPT-5, creo que tenemos muchas otras cosas importantes para publicar primero.”
La compañía aún no ofrece un asistente de voz digital a sus usuarios, aunque sí tiene una API que convierte voz en texto llamada TTS, según su sitio web . También cuenta con un modelo de reconocimiento de voz de propósito general llamado Whisper.
OpenAI también presentó solicitudes de marca para sus futuros modelos, incluidos GPT-6 y GPT-7 en octubre.
La presentación de GPT-6 incluye la simulación de conversaciones, el intercambio de conjuntos de datos con fines de aprendizaje automático, análisis predictivo y “análisis de algoritmos que pueden aprender a analizar, clasificar y tomar acciones en respuesta a la exposición a los datos”.
La solicitud de marca GPT-7 cubre software que utiliza inteligencia artificial para la generación de música, la conversión de archivos de texto y datos en código de software y la creación y generación de código de software. Ambas solicitudes aún están bajo examen.
Es posible que la Oficina de Patentes no conceda esas marcas, aunque en febrero rechazó los intentos de OpenAI de registrar “GPT”. La agencia dijo que es un “acrónimo ampliamente utilizado” que es “meramente descriptivo”, ya que significa “transformadores generativos preentrenados”.
La solicitud de marca “ingeniero de voz”, que está pendiente de revisión por parte de un examinador, pretende cubrir software para las siguientes 10 áreas:
- Creación de asistentes de voz digitales
- Reconocimiento de voz y habla, procesamiento de comandos de voz y conversión entre texto y voz
- Procesar comandos de voz y convertir entre texto y voz
- reconocimiento y generación automática de voz y voz
- Generar salidas de voz y audio basadas en indicaciones de lenguaje natural, texto, voz, indicaciones visuales, imágenes y/o video.
- Generación de audio y/o voz en respuesta a las indicaciones del usuario.
- Procesamiento del habla y lenguaje natural basado en aprendizaje automático
- Reconocimiento, traducción y transcripción de voz multilingüe
- Uso de inteligencia artificial para la conversión automática de texto a voz y de texto a audio
- Desarrollo de la prestación de servicios de voz.