La Hoja de ruta de MLOps, tiene como objetivo exponer una imagen del estado actual del aprendizaje profundo y la ciencia de datos; proporcionando una hoja de ruta para los pr贸ximos cinco a帽os sobre las necesidades futuras de los clientes con el fin de apoyar la colaboraci贸n entre las empresas de la industria con miras a mejorar el estado global del campo del Machine Learning y la Data Sciences.

驴Qu茅 es MLOps?

Consideramos a MLOps como la extensi贸n de la metodolog铆a DevOps incluyendo activos de Machine Learning y Data Science como campos principales de cara a los pr贸ximos a帽os dentro del ciclo de vida del desarrollo de software.

Los productos pr谩cticos del mundo real incluyen la necesidad de componentes convencionales y de Machine Learning (ML), por lo que es fundamental poder administrar todos estos componentes de manera consistente como activos com煤nes dentro del alcance de una soluci贸n tecnol贸gica dada.

Los MLOps deben verse como una pr谩ctica para administrar consistentemente los aspectos de LD (live developmente o desarrollo a tiempo real) de los productos de manera unificada con todos los dem谩s elementos t茅cnicos y no t茅cnicos necesarios para comercializar con 茅xito esos productos con el m谩ximo potencial de viabilidad en el mercado.

Esto tambi茅n incluye DataOps, ya que Machine Learning sin datos completos, consistentes, sem谩nticamente v谩lidos, correctos, oportunos e imparciales es problem谩tico o conduce a soluciones defectuosas que pueden exacerbar los sesgos incorporados.

En la actualidad, la gesti贸n de los activos de ML en producci贸n permanece en una etapa muy temprana de madurez, y la mayor铆a de las organizaciones se ven obligadas a construir soluciones a medida para su implementaci贸n o a limitarse a herramientas altamente espec铆ficas de la ciencia de datos que tratan los componentes de ML como datos no controlados. conjuntos.

En este punto del desarrollo de la pr谩ctica, gran parte de la actividad de investigaci贸n y desarrollo de ML e IA ha sido impulsada por Data Science m谩s que por equipos de Computer Science. Con la creaci贸n de la Hoja de ruta de MLOps, esperamos poder aprovechar las lecciones de los 煤ltimos setenta a帽os de administraci贸n de activos de software en entornos comerciales para acelerar la viabilidad de administrar activos de ML en productos del mundo real.

Existe una brecha significativa entre el esfuerzo requerido para crear una prueba de concepto viable de un modelo ML capacitado en una computadora port谩til de Data Scientist frente a lo que se necesita para poder hacer una transici贸n segura de ese activo a un producto comercial en entornos de producci贸n, y la falta Un buen proceso, experiencia y herramientas para respaldar ese trabajo significa que actualmente la mayor铆a de los experimentos de ML no logran entrar en producci贸n.

Para agravar este desaf铆o, las soluciones de Machine Learning tienden a ser sistemas de toma de decisiones en lugar de solo sistemas de procesamiento de datos y, por lo tanto, deber谩n rendir cuentas a est谩ndares mucho m谩s altos que los aplicados a los proyectos de entrega de software de mejor calidad.

Por lo tanto, la barra para los procesos de calidad y gobernanza es muy alta, en muchos casos representa procesos de cumplimiento legal exigidos por la legislaci贸n regional.

Para enfrentar estos desaf铆os, necesitamos comprender completamente los requisitos inherentes a este dominio y tener una imagen clara de los procesos y herramientas necesarias para facilitar la buena gobernanza y la gesti贸n de activos s贸lidos de los productos que aprovechan las t茅cnicas de LD.

Controladores para MLOps

Muchos de los principios de DevOps existentes se aplican igualmente a los problemas de LA, incluidos:

  • Optimizando el proceso de llevar las caracter铆sticas de ML a producci贸n reduciendo el tiempo de entrega.
  • Optimizaci贸n del ciclo de retroalimentaci贸n entre producci贸n y desarrollo para activos de ML.
  • Unificar el ciclo de lanzamiento de activos tecnol贸gicos.
  • Permitir pruebas automatizadas de activos de ML.
  • Reducci贸n del tiempo medio de restauraci贸n para aplicaciones ML.
  • Reducci贸n del porcentaje de falla de cambio para aplicaciones de ML.
  • Reducci贸n de los gastos generales de gesti贸n de TI a trav茅s de econom铆as de escala.
  • Gestionar el riesgo alineando las entregas de LD a los procesos de gobierno apropiados.

Sin embargo, el espacio del problema MLOps presenta algunos desaf铆os nuevos, tales como:

  • Mitigar los riesgos asociados con la producci贸n de productos para la toma de decisiones.
  • Incorporaci贸n de la gobernanza 茅tica en la gesti贸n de los activos de LA.
  • Habilitaci贸n de pruebas automatizadas de detecci贸n de sesgos.
  • Garantizar la explicabilidad de las decisiones.
  • Garantizar la equidad en las decisiones.
  • Facilitar la auditabilidad de los datos de capacitaci贸n, modelos y conjuntos de pruebas.

El alcance del aprendizaje autom谩tico abarca mucho m谩s que simplemente mover un modelo simple de la computadora port谩til de un cient铆fico de datos a la nube. Los ejemplos pr谩cticos ya incluyen la necesidad de poder volver a entrenar modelos diariamente, utilizando petabytes de datos de entrenamiento, y luego llevar estos modelos entrenados a tel茅fonos m贸viles, veh铆culos, maquinaria, dispositivos port谩tiles y otros dispositivos perif茅ricos altamente especializados para hacer inferencias en tiempo real.

El proceso de la hoja de ruta

La hoja de ruta de MLOps est谩 en proceso de recopilar una imagen clara de todos los desaf铆os fundamentales asociados con la entrega efectiva de productos centrados en la inteligencia artificial. Para cada desaf铆o, la Hoja de ruta identificar谩 requisitos tecnol贸gicos espec铆ficos que ser谩n necesarios para abordar estos desaf铆os de manera fundamental y buscar谩 proponer posibles soluciones en cada 谩rea.

La intenci贸n es proporcionar una actualizaci贸n anual con un horizonte de cinco a帽os, que detalle las capacidades actuales en cada 谩rea de desaf铆o y muestre d贸nde se requiere trabajo futuro para habilitar las capacidades esenciales.

La intenci贸n es facilitar una colaboraci贸n precompetitiva abierta en toda la industria con el fin de acelerar nuestra capacidad compartida para ofrecer productos ML de alta calidad y permitirnos a todos concentrar m谩s nuestros esfuerzos en los dif铆ciles problemas de crear productos de IA verdaderos en el futuro. a帽os.

El Roadmap se gestiona dentro del CDF MLOps SIG, que tambi茅n alberga una serie de proyectos que incuba implementaciones espec铆ficas de desaf铆os t茅cnicos identificados dentro del Roadmap, incluidas las tuber铆as de Kubeflow en Tekton y las extensiones de Jenkins-X MLOps.

馃敟 Seguro tambi茅n te interesa: mejores libros de programaci贸n聽禄 programas para desarrolladores聽禄 mejores lenguajes de programaci贸n聽禄 mejores auriculares para programadores聽禄 ratones verticales para trabajar聽禄 componentes de PC para programadores聽禄 mejores regalos 1 - 馃摝聽禄 mejores regalos 2 - 馃巵

Hoja de ruta a seguir por los desarrolladores del machine learning y la ciencia de datos con la intenci贸n de exponer una imagen del estado actual pra los pr贸ximos 5 a帽os.

馃巵 Visita Nuestra Tienda 馃巵