MLOps

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
MLOps è l'insieme di pratiche all'intersezione di Machine Learning, DevOps e Data Engineering[1]

MLOps o ML Ops è un insieme di pratiche che mira a sviluppare e mantenere i modelli di apprendimento automatico in produzione in modo affidabile ed efficiente.[1] La parola è un composto di "apprendimento automatico" (Machine Learning, ML) e DevOps, la metodologia di sviluppo del software. I modelli di apprendimento automatico sono testati e sviluppati in sistemi sperimentali isolati. Quando un algoritmo è pronto per essere rilasciato, MLOps coinvolge data scientist, sviluppatori DevOps e ingegneri di Machine Learning per portare l'algoritmo in produzione.[2] Simile agli approcci DevOps o DataOps, MLOps cerca di aumentare l'automazione e migliorare la qualità dei modelli di produzione, concentrandosi al contempo anche sui requisiti aziendali e normativi. Sebbene MLOps sia iniziato come un insieme di best practice, si sta lentamente evolvendo in un approccio indipendente alla gestione del ciclo di vita del ML. MLOps si applica all'intero ciclo di vita, dall'integrazione con la generazione del modello (modello di sviluppo del software, integrazione continua/consegna continua ), orchestrazione e distribuzione, all'integrità, alla diagnostica, alla governance e alle metriche aziendali. Secondo Gartner, MLOps è un sottoinsieme di ModelOps . MLOps si concentra sull'operazionalizzazione dei modelli ML, mentre ModelOps copre l'operazionalizzazione di tutti i tipi di modelli di intelligenza artificiale.

Esplora i principali repository MLOps di GitHub per tenere traccia delle tendenze e delle risorse emergenti.

Storia[modifica | modifica wikitesto]

Le sfide dell'uso continuo dell'apprendimento automatico nelle applicazioni sono state evidenziate in un articolo del 2015.[3]

La crescita prevista dell'apprendimento automatico includeva un raddoppio stimato dei progetti pilota e delle implementazioni di ML dal 2017 al 2018 e di nuovo dal 2018 al 2020.[4]

Il progetto open source Kubeflow è stato creato nel 2018 da Jeremy Lewi e David Aronchick presso Google per facilitare MLOps su Kubernetes.

I rapporti mostrano che la maggior parte (fino all'88%) delle iniziative di intelligenza artificiale aziendale sta lottando per andare oltre le fasi di test. Tuttavia, le organizzazioni che hanno effettivamente messo in produzione l'intelligenza artificiale e l'apprendimento automatico hanno visto un aumento del margine di profitto del 3-15%.[5]

Il mercato MLOps è stato stimato a 23,2 miliardi di dollari nel 2019 e si prevede che raggiungerà i 126 miliardi di dollari entro il 2025 grazie alla sua rapida adozione.[6]

Architettura[modifica | modifica wikitesto]

I sistemi di Machine Learning possono essere classificati in otto diverse categorie: raccolta dati, elaborazione dati, ingegneria delle feature, etichettatura dei dati, progettazione del modello, addestramento e ottimizzazione del modello, distribuzione agli endpoint e monitoraggio degli endpoint. Ogni fase del ciclo di vita dell'apprendimento automatico è costruita nel proprio sistema, ma richiede interconnessione. Questi sono i sistemi minimi di cui le aziende hanno bisogno per scalare l'apprendimento automatico all'interno della loro organizzazione.

Obiettivi[modifica | modifica wikitesto]

Ci sono una serie di obiettivi che le aziende vogliono raggiungere attraverso i sistemi MLOps implementando con successo il ML in tutta l'azienda, tra cui:[7]

  • Distribuzione e automazione[8]
  • Riproducibilità di modelli e previsioni[9]
  • Diagnostica[9]
  • Governance e conformità normativa[10]
  • Scalabilità[11]
  • Collaborazione[12]
  • Usi aziendali[13]
  • Monitoraggio e gestione[14]

Una pratica standard, come MLOps, tiene conto di ciascuna delle suddette aree, che può aiutare le aziende a ottimizzare i flussi di lavoro ed evitare problemi durante l'implementazione.

Un'architettura comune di un sistema MLOps includerebbe le piattaforme di data science in cui vengono costruiti i modelli e i motori analitici in cui vengono eseguiti i calcoli, con MLOps che orchestra il movimento di modelli, dati e risultati di apprendimento automatico tra i sistemi.[7]

Note[modifica | modifica wikitesto]

  1. ^ a b (EN) Breuel, Cristiano, "ML Ops: Machine Learning as an Engineering Discipline", su Towards Data Science. URL consultato il 6 luglio 2021.
  2. ^ AITrends, https://web.archive.org/web/20210119030008/https://www.aitrends.com/machine-learning/mlops-not-just-ml-business-new-competitive-frontier/. URL consultato il 14 aprile 2022 (archiviato dall'url originale il 19 gennaio 2021).
  3. ^ Hidden Technical Debt in Machine Learning Systems (PDF), in NIPS Proceedings, n. 2015, 7 dicembre 2015. URL consultato il 14 novembre 2017.
  4. ^ Deloitte, https://www2.deloitte.com/content/dam/Deloitte/global/Images/infographics/technologymediatelecommunications/gx-deloitte-tmt-2018-predictions-full-report.pdf.
  5. ^ McKinsey, https://www.mckinsey.com/~/media/McKinsey/Industries/Advanced%20Electronics/Our%20Insights/How%20artificial%20intelligence%20can%20deliver%20real%20value%20to%20companies/MGI-Artificial-Intelligence-Discussion-paper.ashx.
  6. ^ Neu.ro, https://web.archive.org/web/20230208000813/https://neu.ro/2021-mlops-platforms-vendor-analysis-report/. URL consultato il 14 aprile 2022 (archiviato dall'url originale l'8 febbraio 2023).
  7. ^ a b "The Rise of Quant-Oriented Devs & The Need for Standardized MLOps", su slides.com. URL consultato il 1º gennaio 2018.
  8. ^ (EN) DAGsHub Blog, https://dagshub.com/blog/code-to-production-ready-machine-learning-in-4-steps/. URL consultato il 19 febbraio 2021.
  9. ^ a b Pete Warden's Blog, https://petewarden.com/2018/03/19/the-machine-learning-reproducibility-crisis/.
  10. ^ SearchDataManagement, https://searchdatamanagement.techtarget.com/feature/Machine-learning-algorithms-meet-data-governance.
  11. ^ O'Reilly, https://www.oreilly.com/ideas/how-to-train-and-deploy-deep-learning-at-scale.
  12. ^ IoT Tech Expo, https://www.iottechexpo.com/2017/10/ai/iot-machine-learning-ml-ai-why-collaboration-key/.
  13. ^ McKinsey, https://www.mckinsey.com/featured-insights/digital-disruption/whats-now-and-next-in-analytics-ai-and-automation.
  14. ^ Iguazio, https://www.iguazio.com/blog/mlops-challenges-solutions-future-trends/.