MLOps (un compuesto de aprendizaje autom谩tico y鈥 operaciones de tecnolog铆a de la informaci贸n 鈥) es una nueva disciplina / enfoque / pr谩ctica para la colaboraci贸n y la comunicaci贸n entre los cient铆ficos de datos y los profesionales de la tecnolog铆a de la informaci贸n (TI) al tiempo que automatiza y produce algoritmos de aprendizaje autom谩tico鈥. - Nisha Talagala (2018)

El aprendizaje autom谩tico es un m茅todo de an谩lisis de datos que automatiza la construcci贸n de modelos anal铆ticos. Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de los datos, identificar patrones y tomar decisiones con una m铆nima intervenci贸n humana.

Para integrar un sistema de aprendizaje autom谩tico en un entorno de producci贸n, debe orquestar los pasos en su canal de aprendizaje autom谩tico y automatizar la ejecuci贸n del canal para la capacitaci贸n continua de sus modelos. Para experimentar con nuevas ideas y caracter铆sticas, debe adoptar pr谩cticas de CI / CD en las nuevas implementaciones de las canalizaciones.

La Consistencia del MLOps

Para cualquier organizaci贸n de ingenier铆a, no ser铆a un gran problema ver los componentes de una versi贸n de hace un a帽o y volver a implementar la versi贸n id茅ntica en producci贸n. Adem谩s, la probabilidad de duplicar un modelo de aprendizaje autom谩tico de hace un a帽o con la falta de herramientas adecuadas es m谩s que probable. Esto significa tener la capacidad de rastrear todas las entradas: conjunto de datos, c贸digo, contenedor / tiempo de ejecuci贸n, par谩metros de entrenamiento del modelo, solo por nombrar algunos.

No importa la raz贸n, la consistencia es primordial. El camino hacia el aprendizaje autom谩tico puede verse como un enfoque paradigm谩tico desde procesos ad-hoc hasta una forma de trabajo determinista.

Cooperativa

Digamos, por ejemplo, que est谩 trabajando en un proyecto de Python, y el trabajo que est谩 haciendo es en una instancia EC2 aislada. Si es un miembro individual, puede salirse con la suya, pero cuando pone un modelo en producci贸n o tiene un pu帽ado de personas trabajando en un equipo, este plan es extremadamente fr谩gil. La ausencia de un entorno colaborativo se vuelve especialmente problem谩tico a medida que aumenta el n煤mero de modelos y la complejidad de los modelos.

En teor铆a, la colaboraci贸n comienza con tener un centro unificado donde se pueda rastrear toda la actividad, el linaje y el rendimiento del modelo. Eso no se limita a carreras de entrenamiento, cuadernos de Jupyter, b煤squedas de hiperpar谩metros, visualizaciones, m茅tricas estad铆sticas, conjuntos de datos, referencias de c贸digo y un repositorio de artefactos o repositorio de modelos, como se le llama a menudo. Agregar cosas como el control de acceso y el registro de auditor铆a tambi茅n es un paso cr铆tico.

Al final del d铆a, la comprensi贸n y la colaboraci贸n son esenciales para los equipos de aprendizaje autom谩tico.

Construcci贸n de infraestructura

A diferencia de la ingenier铆a de software, el aprendizaje autom谩tico en la pr谩ctica requiere una gran cantidad de energ铆a computacional, almacenamiento y en la mayor铆a de los casos, grandes infraestructuras.

Cosas como GPU y TPU. Los equipos de aprendizaje autom谩tico necesitan una infraestructura que ofrezca cargas de trabajo f谩ciles de programar y escalar sin necesidad de a帽os de experiencia en redes, Kubernetes, Docker, sistemas de almacenamiento.

Algunos ejemplos de automatizaci贸n de infraestructura:

  • Multi-nube: Una plataforma de aprendizaje autom谩tico deber铆a ser f谩cil de entrenar un modelo en las instalaciones y desplegarlo sin problemas en la nube p煤blica.
  • Escala de cargas de trabajo: A medida que aumentan las demandas computacionales, la capacitaci贸n o los modelos de ajuste que abarcan m煤ltiples instancias de c贸mputo se vuelven esenciales: vol煤menes de almacenamiento compartido dise帽ados con un host distribuido de contenedores que se ejecutan en hardware heterog茅neo.

Idealmente, los equipos de aprendizaje autom谩tico deber铆an operar con total autonom铆a y poseer toda la pila; de esa manera, son mucho m谩s 谩giles. Tambi茅n se necesitan las demandas de los cient铆ficos de datos para que la inform谩tica y el almacenamiento se muevan m谩s r谩pido en la fase de capacitaci贸n de su trabajo.

Con MLOps, la fase de capacitaci贸n es independiente de la infraestructura y escalable y minimiza la complejidad para el cient铆fico de datos.

Intacto

Ahora estamos viendo que hay muy poco en cuanto a la automatizaci贸n en la producci贸n de modelos de aprendizaje autom谩tico.

CI / CD es donde se fusiona el c贸digo de un desarrollador de software para activar una serie de pasos de automatizaci贸n. Abstracciones como estas son cr铆ticas para la confiabilidad de las aplicaciones y la velocidad del desarrollador.

Lamentablemente, no hay equivalente a muchas de las abstracciones en el mundo del aprendizaje autom谩tico.

Clausura

En 煤ltima instancia, el tiempo que lleva pasar del concepto a la producci贸n y entregar valor comercial es un obst谩culo significativo en la industria. Es por eso que necesitamos buenos MLOps dise帽ados para estandarizar y optimizar el ciclo de vida del aprendizaje autom谩tico en la producci贸n.

Como pr谩ctica, DevOps garantiza que el desarrollo del software y el ciclo de vida de las operaciones de TI sea eficiente, bien documentado, escalable y f谩cil de solucionar. MLOps incorpora estas pr谩cticas para ofrecer aplicaciones y servicios de aprendizaje autom谩tico a alta velocidad.

Se est谩 haciendo un trabajo interesante en el campo de MLOps. Google Summer of Code para el proyecto Jenkins. El proyecto involucra la interacci贸n entre un nodo Jenkins y un Kernel de IPython, as铆 como tambi茅n construye un plugin de Jenkins que permitir谩 la integraci贸n de los n煤cleos de port谩tiles pol铆glotas existentes para admitir c谩lculos similares a los de los port谩tiles a medida que Jenkins construye tareas.

El objetivo es permitir que los cient铆ficos de datos definan MLOps de grado de producci贸n a medida que Jenkins construye, integrando tareas de compilaci贸n t铆picas de Jenkins con fragmentos de c贸digo de cuaderno como pasos de compilaci贸n.

El complemento admitir谩 una nueva tarea de compilaci贸n, para ejecutar c贸digo a trav茅s de un 鈥榢ernel鈥 de lenguaje apropiado, tal como lo admiten actualmente los port谩tiles existentes como Zeppelin y Jupyter. Puedes leer m谩s sobre eso aqu铆 .

Continuous Delivery Foundation est谩 trabajando para definir los controladores generales de DevOps que se aplican a MLOps, as铆 como definir los controladores que son exclusivos de las soluciones de aprendizaje autom谩tico que representan los requisitos de MLOps.

Puede encontrar m谩s informaci贸n sobre la hoja de ruta aqu铆.

馃敟 Seguro tambi茅n te interesa: mejores libros de programaci贸n聽禄 programas para desarrolladores聽禄 mejores lenguajes de programaci贸n聽禄 mejores auriculares para programadores聽禄 ratones verticales para trabajar聽禄 componentes de PC para programadores聽禄 mejores regalos 1 - 馃摝聽禄 mejores regalos 2 - 馃巵

MLOps (un compuesto de Machine Learning y "tecnolog铆a de la informaci贸n OPERACIONES") es una nueva disciplina / enfoque / pr谩ctica para la colaboraci贸n y comunicaci贸n entre cient铆ficos de datos y tecnolog铆a de la informaci贸n. es una nueva disciplina / enfoque / pr谩ctica para la colaboraci贸n y comunicaci贸n entre cient铆ficos de datos y tecnolog铆a de la informaci贸n.鈥)

馃巵 Visita Nuestra Tienda 馃巵