Mozilla se asocia con NVIDIA para democratizar y diversificar la tecnología de voz

A medida que la tecnología hace un cambio hacia productos habilitados por voz, NVIDIA invierte 1.5 millones de dólares en Mozilla Common Voice para transformar el panorama del reconocimiento de voz.

Durante la próxima década, se espera que el habla se convierta en la principal forma en que las personas interactúan con los dispositivos, desde computadoras portátiles y teléfonos hasta asistentes digitales y quioscos minoristas.

Sin embargo, los dispositivos de voz de hoy en día son inaccesibles para gran parte de la humanidad porque no pueden comprender vastas franjas de los idiomas, acentos y patrones de habla del mundo.

Para ayudar a garantizar que las personas en todas partes se beneficien de este cambio tecnológico masivo, Mozilla se ha asociado con NVIDIA, que está invirtiendo 1.5 millones de dólares en Mozilla Common Voice.

En lo que se convierte en una ambiciosa iniciativa de código abierto destinada a democratizar y diversificar el desarrollo de la tecnología por voz.

La mayoría de los datos de voz que se utilizan actualmente para entrenar algoritmos de aprendizaje automático están en manos de un puñado de empresas importantes.

Esto plantea desafíos para otros que buscan desarrollar tecnologías de reconocimiento de voz de alta calidad, al mismo tiempo que exacerba la brecha de reconocimiento de voz entre los angloparlantes y el resto del mundo.

Lanzado en 2017, Common Voice tiene como objetivo nivelar el campo de juego al tiempo que mitiga el sesgo de la IA.

Permite a cualquier persona donar su voz a una base de datos gratuita y disponible públicamente que las empresas emergentes, los investigadores y los desarrolladores pueden usar para entrenar aplicaciones, productos y servicios habilitados para voz.

En la actualidad, representa el conjunto de datos de voz de dominio público multilingüe más grande del mundo, con más de 9.000 horas de datos de voz en 60 idiomas diferentes, incluidos los idiomas más hablados y los menos utilizados como el galés y el kinyarwanda, que se habla en Ruanda.

Hasta ahora, más de 164.000 personas en todo el mundo han contribuido al proyecto.

Esta inversión acelerará el crecimiento del conjunto de datos de Common Voice, involucrará a más comunidades y voluntarios en el proyecto y apoyará la contratación de nuevo personal.

Para respaldar la expansión, Common Voice ahora operará bajo el paraguas de la Fundación Mozilla como parte de sus iniciativas enfocadas en hacer que la inteligencia artificial sea más confiable.

Según el director ejecutivo de la Fundación, Mark Surman, Common Voice está preparada para ser pionera en la donación de datos como una herramienta eficaz que el público puede utilizar para mejorar el futuro de la tecnología.

“El idioma es una parte poderosa de quiénes somos, y las personas, no las empresas con fines de lucro, son los guardianes adecuados de cómo aparece el idioma en nuestra vida digital”, dijo Surman.

“Al facilitar la donación de datos de voz, Common Voice permite a las personas desempeñar un papel directo en la creación de tecnología que ayude en lugar de dañar a la humanidad. Tanto Mozilla como NVIDIA ven la voz como una excelente oportunidad en la que las personas pueden recuperar el control de la tecnología y desbloquear todo su potencial “.

“La demanda de IA conversacional está creciendo, con chatbots y asistentes virtuales que impactan en casi todas las industrias”, dijo Kari Briski, directora senior de administración de productos de computación acelerada en NVIDIA.

Con los conjuntos de datos amplios y abiertos de Common Voice, podemos desarrollar modelos previamente entrenados y ofrecerlos a la comunidad de forma gratuita.

Juntos, estamos trabajando hacia un objetivo compartido de apoyar y construir comunidades, particularmente para los idiomas de escasos recursos y deficiente.

Fuente: Mozilla Blog

Relacionados
Salir de la versión móvil