Avances de la Inteligencia Artificial: Aprendizaje No Supervisado en el Reconocimiento Visual

La Inteligencia Artificial (IA) generativa, como ChatGPT, suele acaparar la atención en las reuniones corporativas, pero es importante recordar que los avances en IA van más allá.

El Aprendizaje No Supervisado, es una variante del Machine Learning en la que los datos no están etiquetados, ha emergido como una técnica prometedora.

Relacionados: 9 Mejores Creadores de Contenido con Inteligencia Artificial 2023

En lugar de depender de supervisores, esta técnica busca extraer clases o grupos de objetos con características comunes de datos no etiquetados.

Superando Barreras en el Reconocimiento Visual mediante el Aprendizaje No Supervisado

Armand Joulin

, un investigador en inteligencia artificial, presentó en la feria Big Data & IA un innovador enfoque de entrenamiento de IA para el reconocimiento visual utilizando Aprendizaje No Supervisado. Esta técnica ya es empleada por Meta en el reconocimiento de voz.

El reconocimiento de imágenes solía basarse en el Aprendizaje Supervisado, donde las imágenes se etiquetaban y se enseñaba a la máquina a reconocer esas etiquetas.

Sin embargo, esta técnica es laboriosa y tiene limitaciones al expandirse a otros medios como el vídeo o sensores infrarrojos en smartphones modernos.

Relacionados: 10 Mejores Herramientas de Inteligencia Artificial para Aumentar tu Productividad

El reconocimiento visual abarca mucho más que la simple clasificación. Incluye detectar copias en la lucha contra el plagio, transferencia de estilo y subtítulos; pero cada tarea a menudo requiere una nueva red neuronal entrenada específicamente.

Armand Joulin busca un método para que las máquinas puedan aprender funciones versátiles sin requerir nuevas redes neuronales para cada tarea. Establece dos requisitos previos:

  1. Diversidad de Medios: Las máquinas deben ser educadas en varios medios, como imágenes, vídeo, radio, etc.
  2. Tarea Sencilla: Necesitan una tarea simple, como escribir texto a partir de una imagen.

El investigador plantea el desafío de enseñar a las máquinas a describir las diferencias entre dos imágenes en lugar de describir lo que ven en una sola imagen. Esto se logra al hacer que la IA compare numerosas imágenes y aprenda a notar las diferencias.

Relacionados: ¿Qué será lo próximo en la IA generativa?

Esta técnica de “no supervisión” se muestra más eficiente que el Aprendizaje Supervisado. Permite que la IA clasifique imágenes según similitudes y diferencias sin etiquetarlas, lo que se conoce como clasificación no supervisada.

Con esta tecnología, la IA puede identificar lo más distintivo en imágenes o vídeos, incluso notando similitudes y diferencias en medios muy diversos. Por ejemplo, puede reconocer las diferencias y similitudes entre aviones y pájaros en diferentes formatos, como fotografías, vídeos e incluso objetos 3D.

En resumen, los avances en Aprendizaje No Supervisado están ampliando los horizontes de la IA en el reconocimiento visual, superando barreras y abriendo nuevas posibilidades en la percepción de similitudes y diferencias en una variedad de medios.

La IA está demostrando su capacidad para el reconocimiento de objetos en vídeo y otras aplicaciones más allá de las limitaciones del Aprendizaje Supervisado.

🔥 MÁS ARTÍCULOS RECOMENDADOS 🔥

Comparte tu opinión