Azure Data Factory

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Azure Data Factory
software
GenereData integration, Data transformation, Data orchestration (non in lista)
SviluppatoreMicrosoft Corporation
Sistema operativo
Sito webazure.microsoft.com

Azure Data Factory è un servizio di integrazione di dati basato su cloud sviluppato da Microsoft Corporation. Fornisce strumenti per l'orchestrazione, la trasformazione e l'integrazione (processi ETL) di grandi quantità di dati provenienti da diverse origini in diverse destinazioni[1].

Caratteristiche[modifica | modifica wikitesto]

Azure Data Factory[2] offre diverse funzionalità per agevolare l'integrazione dei dati:

  • Pipeline di dati[3]: permette di definire e orchestrare flussi di lavoro per l'estrazione, la trasformazione e il caricamento dei dati da varie sorgenti verso le destinazioni desiderate.
  • Connessioni ai dati[4]: supporta una vasta gamma di origini e destinazioni di dati, inclusi database relazionali, servizi cloud, file system, servizi di archiviazione, ecc.
  • Trasformazione dei dati: fornisce una serie di strumenti per manipolare e trasformare i dati (dataflow), l'elaborazione dei dati in batch e in streaming, e l'uso di funzioni di data wrangling[5].
  • Monitoraggio e gestione[6][7]: permette di monitorare le pipeline di dati, controllare le prestazioni e gestire le risorse in modo efficiente.

Utilizzo[modifica | modifica wikitesto]

Azure Data Factory è ampiamente utilizzato in scenari aziendali in cui è necessario integrare e orchestrare grandi quantità di dati provenienti da diverse fonti. Alcuni esempi di utilizzo includono[8]:

  • Data integration: Azure Data Factory consente alle aziende di aggregare dati provenienti da varie origini, come database, servizi cloud, applicazioni SaaS, file system, ecc., e di trasformarli in un formato unificato per un'analisi più approfondita.
  • Data transformation: offre funzionalità avanzate per la trasformazione dei dati, inclusa l'elaborazione in batch e in tempo reale, la pulizia dei dati, la normalizzazione, la deduplicazione[9], ecc.
  • Data orchestration: permette di definire flussi di lavoro complessi per orchestrare il movimento dei dati tra le origini e le destinazioni desiderate, garantendo la coerenza e l'integrità dei dati durante il processo.

Note[modifica | modifica wikitesto]

  1. ^ (EN) Compare AWS Glue vs. Azure Data Factory | TechTarget, su Cloud Computing. URL consultato il 14 giugno 2023.
  2. ^ (EN) Introduction to Azure Data Factory, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  3. ^ Pipeline di Azure, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  4. ^ Connettori di Azure, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  5. ^ (EN) Creating a dataflow, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  6. ^ (EN) Azure monitor, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  7. ^ (EN) Patrick Pichler, Custom Logging in Azure Data Factory and Azure Synapse Analytics, su Creative Data, 9 novembre 2022. URL consultato il 14 giugno 2023.
  8. ^ (EN) Data factory use cases, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  9. ^ Cos’è la deduplicazione dei dati?, su hpe.com.

Collegamenti esterni[modifica | modifica wikitesto]

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica