Hoja de Ruta del aprendizaje profundo y la ciencia de datos para los próximos 5 años

La Hoja de ruta de MLOps, tiene como objetivo exponer una imagen del estado actual del aprendizaje profundo y la ciencia de datos; proporcionando una hoja de ruta para los próximos cinco años sobre las necesidades futuras de los clientes con el fin de apoyar la colaboración entre las empresas de la industria con miras a mejorar el estado global del campo del Machine Learning y la Data Sciences.

¿Qué es MLOps?

Consideramos a MLOps como la extensión de la metodología DevOps incluyendo activos de Machine Learning y Data Science como campos principales de cara a los próximos años dentro del ciclo de vida del desarrollo de software.

Los productos prácticos del mundo real incluyen la necesidad de componentes convencionales y de Machine Learning (ML), por lo que es fundamental poder administrar todos estos componentes de manera consistente como activos comúnes dentro del alcance de una solución tecnológica dada.

Los MLOps deben verse como una práctica para administrar consistentemente los aspectos de LD (live developmente o desarrollo a tiempo real) de los productos de manera unificada con todos los demás elementos técnicos y no técnicos necesarios para comercializar con éxito esos productos con el máximo potencial de viabilidad en el mercado.

Esto también incluye DataOps, ya que Machine Learning sin datos completos, consistentes, semánticamente válidos, correctos, oportunos e imparciales es problemático o conduce a soluciones defectuosas que pueden exacerbar los sesgos incorporados.

En la actualidad, la gestión de los activos de ML en producción permanece en una etapa muy temprana de madurez, y la mayoría de las organizaciones se ven obligadas a construir soluciones a medida para su implementación o a limitarse a herramientas altamente específicas de la ciencia de datos que tratan los componentes de ML como datos no controlados.

En este punto del desarrollo de la práctica, gran parte de la actividad de investigación y desarrollo de ML e IA ha sido impulsada por Data Science más que por equipos de Computer Science.

Con la creación de la Hoja de ruta de MLOps, esperamos poder aprovechar las lecciones de los últimos setenta años de administración de activos de software en entornos comerciales para acelerar la viabilidad de administrar activos de ML en productos del mundo real.

Existe una brecha significativa entre el esfuerzo requerido para crear una prueba de concepto viable de un modelo ML capacitado en una computadora portátil de Data Scientist frente a lo que se necesita para poder hacer una transición segura de ese activo a un producto comercial en entornos de producción, y la falta Un buen proceso, experiencia y herramientas para respaldar ese trabajo significa que actualmente la mayoría de los experimentos de ML no logran entrar en producción.

Para agravar este desafío, las soluciones de Machine Learning tienden a ser sistemas de toma de decisiones en lugar de solo sistemas de procesamiento de datos y, por lo tanto, deberán rendir cuentas a estándares mucho más altos que los aplicados a los proyectos de entrega de software de mejor calidad.

Por lo tanto, la barra para los procesos de calidad y gobernanza es muy alta, en muchos casos representa procesos de cumplimiento legal exigidos por la legislación regional.

Para enfrentar estos desafíos, necesitamos comprender completamente los requisitos inherentes a este dominio y tener una imagen clara de los procesos y herramientas necesarias para facilitar la buena gobernanza y la gestión de activos sólidos de los productos que aprovechan las técnicas de LD.

Controladores para MLOps

Muchos de los principios de DevOps existentes se aplican igualmente a los problemas de LA, incluidos:

  1. Optimizando el proceso de llevar las características de ML a producción reduciendo el tiempo de entrega.
  2. Optimización del ciclo de retroalimentación entre producción y desarrollo para activos de ML.
  3. Unificar el ciclo de lanzamiento de activos tecnológicos.
  4. Permitir pruebas automatizadas de activos de ML.
  5. Reducción del tiempo medio de restauración para aplicaciones ML.
  6. Reducción del porcentaje de falla de cambio para aplicaciones de ML.
  7. Reducción de los gastos generales de gestión de TI a través de economías de escala.
  8. Gestionar el riesgo alineando las entregas de LD a los procesos de gobierno apropiados.

Sin embargo, el espacio del problema MLOps presenta algunos desafíos nuevos, tales como:

  1. Mitigar los riesgos asociados con la producción de productos para la toma de decisiones.
  2. Incorporación de la gobernanza ética en la gestión de los activos de LA.
  3. Habilitación de pruebas automatizadas de detección de sesgos.
  4. Garantizar la explicabilidad de las decisiones.
  5. Garantizar la equidad en las decisiones.
  6. Facilitar la auditabilidad de los datos de capacitación, modelos y conjuntos de pruebas.

El alcance del aprendizaje automático abarca mucho más que simplemente mover un modelo simple de la computadora portátil de un científico de datos a la nube. Los ejemplos prácticos ya incluyen la necesidad de poder volver a entrenar modelos diariamente, utilizando petabytes de datos de entrenamiento, y luego llevar estos modelos entrenados a teléfonos móviles, vehículos, maquinaria, dispositivos portátiles y otros dispositivos periféricos altamente especializados para hacer inferencias en tiempo real.

El proceso de la hoja de ruta

La hoja de ruta de MLOps está en proceso de recopilar una imagen clara de todos los desafíos fundamentales asociados con la entrega efectiva de productos centrados en la inteligencia artificial. Para cada desafío, la Hoja de ruta identificará requisitos tecnológicos específicos que serán necesarios para abordar estos desafíos de manera fundamental y buscará proponer posibles soluciones en cada área.

La intención es proporcionar una actualización anual con un horizonte de cinco años, que detalle las capacidades actuales en cada área de desafío y muestre dónde se requiere trabajo futuro para habilitar las capacidades esenciales.

La intención es facilitar una colaboración precompetitiva abierta en toda la industria con el fin de acelerar nuestra capacidad compartida para ofrecer productos ML de alta calidad y permitirnos a todos concentrar más nuestros esfuerzos en los difíciles problemas de crear productos de IA verdaderos en el futuro. años.

El Roadmap se gestiona dentro del CDF MLOps SIG, que también alberga una serie de proyectos que incuba implementaciones específicas de desafíos técnicos identificados dentro del Roadmap, incluidas las tuberías de Kubeflow en Tekton y las extensiones de Jenkins-X MLOps.

? Quizás te interese: mejores libros de programación >> programas para desarrolladores >> mejores lenguajes de programación >> mejores auriculares para programadores >> ratones verticales para trabajar >> componentes de PC para programadores >> mejores regalos 1 – ?

Relacionado

Aprender a programar en Android con Google, desde principiantes hasta avanzado

El equipo de capacitación de desarrolladores de Google publicó recientemente una versión actualizada del curso Fundamentos de desarrollo para Android como una serie continua de tutoriales a través de Google Codelabs. Codelabs hizo su debut como sitio de tutoriales en Google I/O en 2015, y se ha disparado en popularidad como una de las mejores plataformas del mundo para aprender y estudiar absolutamente todo sobre Android. ¡SEGUIR LEYENDO!

Mejores Libros PDF de Programación y Tecnología GRATIS

Los Mejores Libros PDF Gratuitos de Informática. EL sitio perfecto para aprender a programar desde cero para principiantes con las mejores guías gratis. Esta es la mejor lista de libros de programación en PDF en español del mundo. Una completa biblioteca recopilada de cientos y cientos de libros en PDF que no encontrarás en ninguna parte más. Aquí, vas a encontrar libros enfocados hacía programadores. Sobre ¡SEGUIR LEYENDO!

27 Cursos Gratuitos de Udemy: SEO, Desarrollo Web, Bootstrap, etc (21 de Abril)

Vamos con los cursos gratuitos de esta semana, tanto en español como en inglés. En total, 4 cursitos en español (SQL Server, Ciencia de Datos, WordPress Básico y Photoshop) y 14 cursos en inglés (Javascript, React, Grunt, Azure Devops, Servicios AWS, Python, OpenCV, C++, SEO, Adobe Photoshop y Adobe Animate). Os recuerdo, que los cursos están filtrados, por los cursos que "en principio" tienen mejor pinta. ¡SEGUIR LEYENDO!

28 Cursos Gratis de Udemy (cupón finalizado)

Cursos variados, entre los que vas a poder aprender Javascript, NET, Python, Java, R, AWS, SQL, Linux y más. Juegos Gratis de Abril: Steel Rats ? JUEGO GRATIS STEAM > World's Dawn ? JUEGO INDIE GALA > Age of Steel Recharge ? JUEGO INDIE GALA > Dwarflings ? JUEGO INDIE GALA > Survivalist ? JUEGO INDIE GALA Cursos en Español Curso Gratuito Iniciacion a la programacion ¡SEGUIR LEYENDO!

48 Mejores Cursos Gratis de Servicios en la Nube y Servidores

Recopilatorio de cursos enfocados en aprender a manejar servicios o crear servicios dentro de un servidor online o en la nube.

Desafío de Habilidades de Microsoft Ignite (+ Examen de Certificación Gratis)

Obtén un examen de certificación de Microsoft gratis mientras aprendes nuevas habilidades. Existen 7 desafíos diferentes entre los que puedes elegir, debes seleccionar el más adecuado a tu rol. El plazo para completar tu desafío, finaliza el 30 de marzo de 2021 a las 4:00 PM UTC (16:00) y debes asegurarte de que todos los módulos de tu desafío estén completos antes de que se acabe ¡SEGUIR LEYENDO!

¿Qué es un ingeniero de datos? Salario, responsabilidades y hoja de ruta

Los datos son el nuevo petróleo. Pero, ¿Quién extrae y refina este valioso aceite? ¡Ingenieros de datos! Los ingenieros de datos diseñan y desarrollan los sistemas para convertir los datos sin procesar, en datos de alta calidad que se pueden usar para realizar análisis y modelado. El primer paso de cualquier organización centrada en los datos es recopilar datos de fuentes dispares. Luego, los datos se ¡SEGUIR LEYENDO!