Meta presenta el modelo de generación de voz Voicebox

Meta recientemente dio un paso significativo en el dominio de la inteligencia artificial generativa para el habla, al presentar un modelo de IA de vanguardia llamado Voicebox.

Este desarrollo representa un avance sustancial en la investigación de IA generativa, que demuestra posibles aplicaciones futuras en una multitud de áreas.

Voicebox, el novedoso modelo de IA de Meta, representa un gran avance en las tareas de generación de voz.

La característica notable de Voicebox es su capacidad para realizar tareas para las que no fue entrenado explícitamente, aprovechando el poder del aprendizaje en contexto.

Esto permite que Voicebox produzca clips de audio de alta calidad y edite audio pregrabado, como eliminar sonidos no deseados como bocinas de autos o ladridos de perros, todo mientras conserva el contenido y el estilo del audio. El modelo también es multilingüe, capaz de generar voz en seis idiomas diferentes.

La aparición de modelos de IA generativa multipropósito como Voicebox apunta hacia un futuro emocionante.

Podrían servir para dar voces de sonido natural a los asistentes virtuales y personajes que no son jugadores en el metaverso, permitir que las personas con discapacidad visual escuchen mensajes escritos de amigos leídos por IA en sus voces y proporcionar a los creadores herramientas innovadoras para crear y editar pistas de audio, vídeos, entre otras muchas posibilidades.

Capacidades versátiles de Voicebox

La versatilidad de Voicebox abarca una variedad de tareas, presentándose como una herramienta innovadora en el espacio de audio e IA:

  • Síntesis de texto a voz en contexto: Voicebox puede usar una breve muestra de audio, tan corta como dos segundos, para que coincida con el estilo de audio para la generación de texto a voz.
  • Edición de voz y reducción de ruido: Voicebox puede reproducir partes interrumpidas del discurso o reemplazar palabras mal pronunciadas sin necesidad de volver a grabar todo el discurso. En esencia, actúa como un borrador para la edición de audio y ofrece una solución única para los desafíos comunes de audio.
  • Transferencia de estilo entre idiomas: Voicebox puede generar una lectura de un texto en cualquiera de los seis idiomas, incluso si el discurso de muestra y el texto están en diferentes idiomas. Esta capacidad podría ser fundamental para ayudar a las personas a comunicarse de manera auténtica, incluso si no comparten un idioma común.
  • Muestreo de voz diverso: debido a su aprendizaje de datos diversos, Voicebox puede generar un habla representativa de la variedad en conversaciones del mundo real, en seis idiomas.

Un futuro prometedor para la IA generativa

La introducción de Voicebox es un hito fundamental en la investigación de IA generativa. Su desarrollo significa cómo la IA está evolucionando, acercándose a comprender y replicar los matices de la comunicación humana.

Los usos potenciales de Voicebox son amplios, desde mejorar la comunicación virtual hasta capacitar a los creadores con herramientas de edición de audio más sofisticadas, hasta romper las barreras del idioma.

Sin embargo, si bien las oportunidades son emocionantes, también es necesario considerar las implicaciones éticas de dicha tecnología. La capacidad de los modelos de IA como Voicebox para imitar voces individuales plantea dudas sobre el consentimiento y la privacidad.

¿Cómo se regularán estas tecnologías para garantizar que se utilicen de manera responsable? ¿Cómo protegeremos las voces de las personas para que no sean explotadas o abusadas? Estos son desafíos que empresas como Meta tendrán que abordar a medida que la IA generativa continúe progresando.

Voicebox es solo el comienzo. A medida que otros investigadores se basan en el trabajo de Meta, el futuro del espacio de audio y la investigación de IA generativa son muy prometedores y potenciales.

Estamos en el precipicio de una nueva era en inteligencia artificial, una que continúa desdibujando las líneas entre lo digital y lo físico.

Relacionado

Después de la pausa navideña, vendrán grandes despidos en casi todas las grandes tecnológicas

Los despidos de Big Tech están sucediendo y seguirá así a lo largo de 2023, probablemente aún nos quede por ver la peor parte. Después de la desaceleración navideña, los despidos serán inminentes en la gran mayoría de empresas tecnológicas. A partir de enero, varias grandes empresas, lideradas por las empresas tecnológicas tienen planificada una gran reestructuración que se traducirá en miles de despidos. Según los ¡SEGUIR LEYENDO!

Los altos precios de los nuevos visores de realidad extendida de Meta y Apple

Apple y Meta se están preparando para lanzar una nueva generación de visores de realidad extendida durante el próximo año, las nuevas gafas ofrecerán una experiencia de usuario fundamentalmente nueva, combinando objetos reales y virtuales. Al mismo tiempo, se espera que el precio de los nuevos dispositivos no sea par nada baratos; de hecho, quizás sean varias veces más caros que los dispositivos ya existentes. Hoy ¡SEGUIR LEYENDO!

Meta, Microsoft y Amazon lanzan un proyecto de mapas de código abierto

Meta, Microsoft, Amazon y la empresa de mapas TomTom han lanzado una iniciativa para enfrentarse a Google Maps y Apple Maps. Las cuatro empresas formaron Overture Maps Foundation el año pasado con el objetivo de crear productos de mapas interoperables y ahora, el grupo ha lanzado su primer conjunto de datos de mapas abiertos. Con estos datos, los desarrolladores externos pueden crear mapas globales o productos ¡SEGUIR LEYENDO!

Carrera por el Metaverso: Los gigantes tecnológicos que pelean por implantar un nuevo paradigma en la industria tecnológica

Actualmente, el metaverso es uno de los términos más utilizados en el campo de la tecnología. ¿De quién fue la idea del Metaverso? A Mark Zuckerberg, CEO de Meta, se le atribuye haber sembrado el concepto del metaverso pero en realidad, no fue hasta 2014 que Mark Zuckerberg impactó significativamente en el campo de la realidad virtual; tras la compra de la plataforma de realidad virtual ¡SEGUIR LEYENDO!

¿Cómo Meta afronta la guerra de Ucrania?

La empresa matriz de Facebook, Meta, declaró el domingo por la noche que eliminó una operación coordinada de influencia rusa que apuntaba a los ucranianos en Facebook e Instagram. La compañía declaró que la campaña de desinformación tiene vínculos con otra red rusa en la región de Donbas que previamente fue prohibida en Facebook en abril de 2020. Además de la operación de influencia, Meta dice ¡SEGUIR LEYENDO!

Cómo ver el testimonio de Mark Zuckerberg, Linda Yaccarino y otros CEOs de tecnología en el Congreso

Hoy, el Comité Judicial del Senado de los Estados Unidos escuchará el testimonio de cinco CEOs de importantes empresas tecnológicas: Linda Yaccarino de X, Shou Zi Chew de TikTok, Evan Spiegel de Snap, Mark Zuckerberg de Meta y Jason Citron de Discord. Los ejecutivos responderán preguntas sobre el tema de "Big Tech y la crisis de explotación sexual infantil en línea", un problema constante para un ¡SEGUIR LEYENDO!

La junta directiva de Meta sugiere eliminar los privilegios a los usuarios más populares

La junta directiva de Meta (propietaria de Facebook, Instagram y WhatsApp) recomendó a la empresa actualizar su política de moderación y privar a los usuarios con una gran cantidad de seguidores de una posición privilegiada que les permita romper las reglas generales de las redes sociales. https://ciberninjas.com/instagram-idoneidad-contribuciones-si-quieren-ser-recomendados/ La práctica, conocida como “verificación cruzada” prevé un proceso de moderación especial para varios millones de cuentas de Facebook, ¡SEGUIR LEYENDO!

Salir de la versión móvil