La Hoja de ruta de MLOps, tiene como objetivo exponer una imagen del estado actual del aprendizaje profundo y la ciencia de datos; proporcionando una hoja de ruta para los próximos cinco años sobre las necesidades futuras de los clientes con el fin de apoyar la colaboración entre las empresas de la industria con miras a mejorar el estado global del campo del Machine Learning y la Data Sciences.

¿Qué es MLOps?

Consideramos a MLOps como la extensión de la metodología DevOps incluyendo activos de Machine Learning y Data Science como campos principales de cara a los próximos años dentro del ciclo de vida del desarrollo de software.

Los productos prácticos del mundo real incluyen la necesidad de componentes convencionales y de Machine Learning (ML), por lo que es fundamental poder administrar todos estos componentes de manera consistente como activos comúnes dentro del alcance de una solución tecnológica dada.

Los MLOps deben verse como una práctica para administrar consistentemente los aspectos de LD (live developmente o desarrollo a tiempo real) de los productos de manera unificada con todos los demás elementos técnicos y no técnicos necesarios para comercializar con éxito esos productos con el máximo potencial de viabilidad en el mercado.

Esto también incluye DataOps, ya que Machine Learning sin datos completos, consistentes, semánticamente válidos, correctos, oportunos e imparciales es problemático o conduce a soluciones defectuosas que pueden exacerbar los sesgos incorporados.

En la actualidad, la gestión de los activos de ML en producción permanece en una etapa muy temprana de madurez, y la mayoría de las organizaciones se ven obligadas a construir soluciones a medida para su implementación o a limitarse a herramientas altamente específicas de la ciencia de datos que tratan los componentes de ML como datos no controlados.

En este punto del desarrollo de la práctica, gran parte de la actividad de investigación y desarrollo de ML e IA ha sido impulsada por Data Science más que por equipos de Computer Science.

Con la creación de la Hoja de ruta de MLOps, esperamos poder aprovechar las lecciones de los últimos setenta años de administración de activos de software en entornos comerciales para acelerar la viabilidad de administrar activos de ML en productos del mundo real.

Existe una brecha significativa entre el esfuerzo requerido para crear una prueba de concepto viable de un modelo ML capacitado en una computadora portátil de Data Scientist frente a lo que se necesita para poder hacer una transición segura de ese activo a un producto comercial en entornos de producción, y la falta Un buen proceso, experiencia y herramientas para respaldar ese trabajo significa que actualmente la mayoría de los experimentos de ML no logran entrar en producción.

Para agravar este desafío, las soluciones de Machine Learning tienden a ser sistemas de toma de decisiones en lugar de solo sistemas de procesamiento de datos y, por lo tanto, deberán rendir cuentas a estándares mucho más altos que los aplicados a los proyectos de entrega de software de mejor calidad.

Por lo tanto, la barra para los procesos de calidad y gobernanza es muy alta, en muchos casos representa procesos de cumplimiento legal exigidos por la legislación regional.

Para enfrentar estos desafíos, necesitamos comprender completamente los requisitos inherentes a este dominio y tener una imagen clara de los procesos y herramientas necesarias para facilitar la buena gobernanza y la gestión de activos sólidos de los productos que aprovechan las técnicas de LD.

Controladores para MLOps

Muchos de los principios de DevOps existentes se aplican igualmente a los problemas de LA, incluidos:

  • Optimizando el proceso de llevar las características de ML a producción reduciendo el tiempo de entrega.
  • Optimización del ciclo de retroalimentación entre producción y desarrollo para activos de ML.
  • Unificar el ciclo de lanzamiento de activos tecnológicos.
  • Permitir pruebas automatizadas de activos de ML.
  • Reducción del tiempo medio de restauración para aplicaciones ML.
  • Reducción del porcentaje de falla de cambio para aplicaciones de ML.
  • Reducción de los gastos generales de gestión de TI a través de economías de escala.
  • Gestionar el riesgo alineando las entregas de LD a los procesos de gobierno apropiados.

Sin embargo, el espacio del problema MLOps presenta algunos desafíos nuevos, tales como:

  • Mitigar los riesgos asociados con la producción de productos para la toma de decisiones.
  • Incorporación de la gobernanza ética en la gestión de los activos de LA.
  • Habilitación de pruebas automatizadas de detección de sesgos.
  • Garantizar la explicabilidad de las decisiones.
  • Garantizar la equidad en las decisiones.
  • Facilitar la auditabilidad de los datos de capacitación, modelos y conjuntos de pruebas.

El alcance del aprendizaje automático abarca mucho más que simplemente mover un modelo simple de la computadora portátil de un científico de datos a la nube. Los ejemplos prácticos ya incluyen la necesidad de poder volver a entrenar modelos diariamente, utilizando petabytes de datos de entrenamiento, y luego llevar estos modelos entrenados a teléfonos móviles, vehículos, maquinaria, dispositivos portátiles y otros dispositivos periféricos altamente especializados para hacer inferencias en tiempo real.

El proceso de la hoja de ruta

La hoja de ruta de MLOps está en proceso de recopilar una imagen clara de todos los desafíos fundamentales asociados con la entrega efectiva de productos centrados en la inteligencia artificial. Para cada desafío, la Hoja de ruta identificará requisitos tecnológicos específicos que serán necesarios para abordar estos desafíos de manera fundamental y buscará proponer posibles soluciones en cada área.

La intención es proporcionar una actualización anual con un horizonte de cinco años, que detalle las capacidades actuales en cada área de desafío y muestre dónde se requiere trabajo futuro para habilitar las capacidades esenciales.

La intención es facilitar una colaboración precompetitiva abierta en toda la industria con el fin de acelerar nuestra capacidad compartida para ofrecer productos ML de alta calidad y permitirnos a todos concentrar más nuestros esfuerzos en los difíciles problemas de crear productos de IA verdaderos en el futuro. años.

El Roadmap se gestiona dentro del CDF MLOps SIG, que también alberga una serie de proyectos que incuba implementaciones específicas de desafíos técnicos identificados dentro del Roadmap, incluidas las tuberías de Kubeflow en Tekton y las extensiones de Jenkins-X MLOps.

🔥 Seguro también te interesa: mejores libros de programación » programas para desarrolladores » mejores lenguajes de programación » mejores auriculares para programadores » ratones verticales para trabajar » componentes de PC para programadores » mejores regalos 1 - 📦

Hoja de ruta a seguir por los desarrolladores del machine learning y la ciencia de datos con la intención de exponer una imagen del estado actual pra los próximos 5 años.

🔥 Ojea las Mejores Ofertas Ninja, ¡Actualizadas a Diario! 🎁