Codec de audio impulsado por Inteligencia Artificial promete una compresión 10 veces mayor que la del MP3

La semana pasada, Meta anunció un método de compresión de audio impulsado por Inteligencia Artificial llamado “EnCodec” qu, según se informa, puede comprimir audio 10 veces más pequeño que el formato MP3 a 64 kbps sin pérdida de calidad.

Meta dice que esta técnica podría mejorar drásticamente la calidad del sonido del habla en conexiones de bajo ancho de banda, como las llamadas telefónicas.

Meta presentó la tecnología el 25 de octubre en un artículo titulado “Compresión de audio neuronal de alta fidelidad” escrito por los investigadores de Meta AI: Alexandre Défossez , Jade Copet, Gabriel Synnaeve y Yossi Adi.

15 Mejores Editores de Audio Gratuitos

Meta también resumió la investigación en su blog dedicado a EnCodec así:

Meta describe su método como un sistema de tres partes entrenado para comprimir audio a un tamaño objetivo deseado. En primer lugar, el codificador transforma los datos sin comprimir en una representación de “espacio latente” de velocidad de fotogramas más baja.

El “cuantificador” luego comprime la representación al tamaño objetivo mientras realiza un seguimiento de la información más importante que luego se usará para reconstruir la señal original.

5 Mejores aplicaciones para configurar tu micrófono en la PC

Finalmente, el decodificador vuelve a convertir los datos comprimidos en audio en tiempo real utilizando una red neuronal en una sola CPU.

El uso de discriminadores por parte de Meta resulta clave para crear un método para comprimir el audio tanto como sea posible sin perder elementos clave de una señal que la hacen distintiva y reconocible:

RELACIONADOS: Estación de trabajo de audio digital Ardor, ahora incluye soporte de OGG comprimido

Vale la pena señalar que el uso de una red neuronal para la compresión y descompresión de audio está lejos de ser nuevo, especialmente para la compresión de voz, pero los investigadores de Meta afirman que son el primer grupo en aplicar la tecnología a audio estéreo de 48 kHz (ligeramente mejor que la frecuencia de muestreo de 44,1 kHz de CD) que es típico de los archivos de música distribuidos en Internet.

Lanzan Audacity 3.0: Con un formato mejorado para tud proyectos de audio

En cuanto a las aplicaciones, Meta dice que esta “hipercompresión de audio” impulsada por IA podría admitir “llamadas más rápidas y de mejor calidad” en malas condiciones de red.

Por supuesto, siendo Meta, los investigadores también mencionan las implicaciones del metaverso de EnCodec diciendo que la tecnología eventualmente podría ofrecer “experiencias ricas en el metaverso sin requerir mejoras importantes en el ancho de banda”.

Más allá de eso, tal vez también obtengamos archivos de audio de música realmente pequeños algún día.

Por ahora, la nueva tecnología de Meta permanece en la fase de investigación, pero apunta hacia un futuro donde el audio de alta calidad puede usar menos ancho de banda, lo que sería una gran noticia para los proveedores de banda ancha móvil con redes sobrecargadas de transmisión.

Relacionado

¿Qué significa AAC? Codificación de audio avanzada

RELACIONADOS: Lanzan Audacity 3.0: Con un formato mejorado para tud proyectos de audio

La codificación de audio avanzada (AAC) es una técnica utilizada para comprimir y codificar archivos de audio digital de esquema. La tecnología AAC se puede utilizar para codificar archivos de audio a velocidades de bits medias a altas. AAC está diseñado para ser el sucesor lógico de MP3 (ISO/MPEG Audio Layer -3) y pretende ofrecer una mejor calidad de sonido que su predecesor con la misma ¡SEGUIR LEYENDO!

¿Qué significa AAF? Formato de autoría avanzado

El formato de creación avanzada (AAF) es un formato de archivo multiplataforma que permite el intercambio de datos entre herramientas multimedia. El formato fue desarrollado por Microsoft en 1998 y fue diseñado para ser un formato de archivo común que todas las aplicaciones de creación multimedia pueden usar para crear presentaciones multimedia. AAF tiene como objetivo brindar a los diseñadores la opción de utilizar una gran ¡SEGUIR LEYENDO!

Estación de trabajo de audio digital Ardor, ahora incluye soporte de OGG comprimido

La nueva versión también incluye MIDI Learn for Cue, importación de letras de archivos MIDI y muchas mejoras más. https://ciberninjas.com/15-mejores-editores-audio/ Un mes y medio después del lanzamiento de Ardor 7.1, Paul Davis y el equipo detrás de esta estación de trabajo de audio digital (DAW) multiplataforma, gratuita y de código abierto, lanzan Ardor 7.2. En esta nueva versión, llega una modesta actualización de software que trae ¡SEGUIR LEYENDO!

Lanzan Audacity 3.0: Con un formato mejorado para tud proyectos de audio

Audacity anunció el lanzamiento de Audacity 3.0.0 que reemplaza a todas las versiones anteriores para Windows, macOS y Linux. Audacity 3.0 es una actualización importante de uno de los más importantes editores de audio. Uno de los cambios más importantes, es que han cambiado el formato en el que se guardan los proyectos de Audacity. Cambio de formato por defecto de Audacity Anteriormente, los proyectos se ¡SEGUIR LEYENDO!

RELACIONADOS: ¿Qué significa la ley A?

Creador de música retro inspirado en Amiga Protracker: Bassontracker

Bassoontracker es una mesa de mezclas basada en una antiguo software creada para los ordenadores Amiga.

Cursos Gratis de Animación, Diseño Gráfico, Diseño 3D, Sonido Vídeo y Más

Los mejores cursos seleccionados de diseño, diseño vectorial, diseño 3D y otras artes relacionadas. Diseño Gráfico Recursos / Aprender Diseño Gráfico / Diseño Web Recursos / Aprender Diseño Web Animación & 3D 3D Studio Max 3D Studio Max + Unreal Engine 4 3D Studio Max Básico: crea una imagen fotorrealista (Crehana) 3D Studio Max Curso Completo 3D Studio Max Curso Intensivo 3D Studio Max Modificadores Audivisuales ¡SEGUIR LEYENDO!

FxSound 1.1.18: Descargar GRATIS aquí

FxSound (anteriormente DFX Audio Enhancer / FxSound Enhancer) es una aplicación de mejora de audio asequible diseñado para todos los sistemas de sonido de PC, desde el promedio hasta el audiófilo. https://youtu.be/Cfr_QltDzUQ?list=PL3RgOga6m7hzWFgyJvdwdxPPjbBEQKxsg Tan automático o personalizable como desees, utiliza el procesamiento de más alto nivel para brindar más volumen, mejor ecualización y un sonido más amplio y profundo. Para los audiófilos serios, FxSound brinda las herramientas ¡SEGUIR LEYENDO!

Deja un comentario