Scienza dei dati: differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
Storia della data science
Riga 1: Riga 1:
{{S|statistica}}
{{S|statistica}}
La '''scienza dei dati''' (in [[lingua inglese|inglese]] '''''data science''''') è l'insieme di principi metodologici (basati sul [[metodo scientifico]]) e tecniche [[Interdisciplinarità|multidisciplinari]] volto a interpretare ed estrarre [[conoscenza]] dai [[dato|dati]] attraverso la relativa fase di [[analisi dei dati|analisi]] da parte di un esperto (''data scientist'')<ref>{{en}} {{Cita pubblicazione|nome=Foster|cognome=Provost|data=13 febbraio 2013|titolo=Data Science and its Relationship to Big Data and Data-Driven Decision Making|rivista=Big Data|volume=1|numero=1|pp=51–59|accesso=27 agosto 2017|doi=10.1089/big.2013.1508|url=http://online.liebertpub.com/doi/abs/10.1089/big.2013.1508|nome2=Tom|cognome2=Fawcett}}</ref><ref>{{Cita pubblicazione|nome=Vasant|cognome=Dhar|data= dicembre 2013|titolo=Data Science and Prediction|rivista=Commun. ACM|volume=56|numero=12|pp=64–73|accesso=27 agosto 2017|doi=10.1145/2500499|url=http://doi.acm.org/10.1145/2500499}}</ref>.
La '''scienza dei dati''' (in [[lingua inglese|inglese]] '''''data science''''') è l'insieme di principi metodologici (basati sul [[metodo scientifico]]) e tecniche [[Interdisciplinarità|multidisciplinari]] volto a interpretare ed estrarre [[conoscenza]] dai [[dato|dati]] attraverso la relativa fase di [[analisi dei dati|analisi]] da parte di un esperto (''Data Scientist'')<ref>{{en}} {{Cita pubblicazione|nome=Foster|cognome=Provost|data=13 febbraio 2013|titolo=Data Science and its Relationship to Big Data and Data-Driven Decision Making|rivista=Big Data|volume=1|numero=1|pp=51–59|accesso=27 agosto 2017|doi=10.1089/big.2013.1508|url=http://online.liebertpub.com/doi/abs/10.1089/big.2013.1508|nome2=Tom|cognome2=Fawcett}}</ref><ref>{{Cita pubblicazione|nome=Vasant|cognome=Dhar|data= dicembre 2013|titolo=Data Science and Prediction|rivista=Commun. ACM|volume=56|numero=12|pp=64–73|accesso=27 agosto 2017|doi=10.1145/2500499|url=http://doi.acm.org/10.1145/2500499}}</ref>.


I metodi della scienza dei dati (spesso associati al concetto di ''[[data mining]]'') si basano su tecniche provenienti da varie discipline, principalmente da [[matematica]], [[statistica]], scienza dell'informazione e [[informatica]], in particolar modo nei seguenti sottodomini: [[Base di dati|basi di dati]] e visualizzazione dati o ''[[business intelligence]]'', [[intelligenza artificiale]] o [[apprendimento automatico]] (vedi anche [[Big data]]).
I metodi della scienza dei dati (spesso associati al concetto di ''[[data mining]]'') si basano su tecniche provenienti da varie discipline, principalmente da [[matematica]], [[statistica]], scienza dell'informazione e [[informatica]], in particolar modo nei seguenti sottodomini: [[Base di dati|basi di dati]] e visualizzazione dati o ''[[business intelligence]]'', [[intelligenza artificiale]] o [[apprendimento automatico]] (vedi anche [[Big data]]).


Il ruolo di scienziato dei dati è stato definito dalla «[[Harvard Business Review]]» come "la professione più ''sexy'' del ventunesimo secolo"<ref>{{Cita news|url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century|titolo=Data Scientist: The Sexiest Job of the 21st Century|pubblicazione=Harvard Business Review|accesso=27 agosto 2017}}</ref> ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei ''[[big data]]'' nelle aziende<ref>{{Cita pubblicazione|nome=Andrea|cognome=De Mauro|titolo=Human resources for Big Data professions: A systematic classification of job roles and required skill sets|rivista=Information Processing & Management|accesso=27 agosto 2017|doi=10.1016/j.ipm.2017.05.004|url=http://linkinghub.elsevier.com/retrieve/pii/S0306457317300018|nome2=Marco|cognome2=Greco|nome3=Michele|cognome3=Grimaldi}}</ref>.
Il ruolo di scienziato dei dati è stato definito dalla «[[Harvard Business Review]]» come "la professione più ''sexy'' del ventunesimo secolo"<ref>{{Cita news|url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century|titolo=Data Scientist: The Sexiest Job of the 21st Century|pubblicazione=Harvard Business Review|accesso=27 agosto 2017}}</ref> ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei ''[[Big data]]'' nelle aziende<ref>{{Cita pubblicazione|nome=Andrea|cognome=De Mauro|titolo=Human resources for Big Data professions: A systematic classification of job roles and required skill sets|rivista=Information Processing & Management|accesso=27 agosto 2017|doi=10.1016/j.ipm.2017.05.004|url=http://linkinghub.elsevier.com/retrieve/pii/S0306457317300018|nome2=Marco|cognome2=Greco|nome3=Michele|cognome3=Grimaldi}}</ref>.

== Storia ==
Il termine "data science" è stato introdotto per la prima volta nel 1974 dall'informatico danese [[Peter Naur]] nel suo libro "Concise Survey of Computer Methods" come evoluzione del concetto di "datalogy" utilizzato dallo stesso Peter Naur qualche anno prima<ref>{{Cita pubblicazione|autore=Peter Naur|anno=1966|titolo=The science of datalogy|rivista=Communications of the ACM|volume=9|numero=7}}</ref> per contrapporlo al concetto più limitativo di informatica o "computer science". In questa prima definizione, Naur intende la scienza dei dati come una disciplina relativa alla gestione e alla manipolazione dei dati così come costituiti<ref>{{Cita libro|autore=Peter Naur|titolo=Concise Survey of Computer Methods|data=1974|editore=Studentlitteratur}}</ref>, ponendo poca enfasi alla possibilità di estrarre, dagli stessi dati, informazioni di utilità commerciale.

La scienza dei dati è stata riconosciuta disciplina indipendente e slegata da informatica e statistica soltanto nel 2001, quando William Clevaland stabilì i campi di competenza della data science, inscrivendoli in 6 diverse aree: ricerca multidisciplinare, modelli, elaborazione dati, pedagogia, valutazione degli strumenti e teoria<ref>{{Cita pubblicazione|autore=William S. Cleveland|anno=2001|titolo=Data science: An action plan for expanding the technical areas of the field of statistics|rivista=International Statistical Review|volume=|numero=|url=https://www.semanticscholar.org/paper/Data-science%3A-An-action-plan-for-expanding-the-of-Cleveland/915cd8e2b39eb02723553913d592b2237d4d9960}}</ref>.

Con l'avvento dei big data e dell'idea di "valore del dato" propria di questo paradigma, evolve il concetto stesso di data science, che diviene così una scienza olistica, il quale principio fondante non è la mera gestione del dato, ma una più ampia valorizzazione della grande mole eterogenea di dati proveniente dalle diverse fonti (data warehouse, sensori, web, ecc...). La data science al giorno d'oggi va quindi intesa come una disciplina trasversale a cui fanno capo sia le sfere dell'informatica, della statistica e della matematica, come nell'accezione originale, sia un set di competenze più manageriali e astrattive, legate alla più recente necessità di sapere leggere, interpretare e capitalizzare i dati a fini di business.

L'Osservatorio Big Data Analytics & Business Intelligence del [[Politecnico di Milano]] nel 2018 ha svolto un’analisi delle offerte di lavoro pubblicate su [[LinkedIn|Linkedin]] individuando le figure professionali più richieste in ambito data science dalle aziende. Da quest'analisi è possibile individuare almeno tre tipi di profili professionali distinti: il Data Scientist, il Data Engineer e il Data Analyst.<ref>{{Cita web|url=https://blog.osservatori.net/it_it/data-science-must-have|titolo=Data Science: i must have per la gestione dei Big Data}}</ref>


== Note ==
== Note ==
<references />
<references />

== Voci correlate ==
[[Big data|Big Data]]

[[Big data analytics|Big Data Analytics]]

[[Analisi dei dati|Analisi dati]]


== Altri progetti ==
== Altri progetti ==

Versione delle 19:42, 10 mar 2019

La scienza dei dati (in inglese data science) è l'insieme di principi metodologici (basati sul metodo scientifico) e tecniche multidisciplinari volto a interpretare ed estrarre conoscenza dai dati attraverso la relativa fase di analisi da parte di un esperto (Data Scientist)[1][2].

I metodi della scienza dei dati (spesso associati al concetto di data mining) si basano su tecniche provenienti da varie discipline, principalmente da matematica, statistica, scienza dell'informazione e informatica, in particolar modo nei seguenti sottodomini: basi di dati e visualizzazione dati o business intelligence, intelligenza artificiale o apprendimento automatico (vedi anche Big data).

Il ruolo di scienziato dei dati è stato definito dalla «Harvard Business Review» come "la professione più sexy del ventunesimo secolo"[3] ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei Big data nelle aziende[4].

Storia

Il termine "data science" è stato introdotto per la prima volta nel 1974 dall'informatico danese Peter Naur nel suo libro "Concise Survey of Computer Methods" come evoluzione del concetto di "datalogy" utilizzato dallo stesso Peter Naur qualche anno prima[5] per contrapporlo al concetto più limitativo di informatica o "computer science". In questa prima definizione, Naur intende la scienza dei dati come una disciplina relativa alla gestione e alla manipolazione dei dati così come costituiti[6], ponendo poca enfasi alla possibilità di estrarre, dagli stessi dati, informazioni di utilità commerciale.

La scienza dei dati è stata riconosciuta disciplina indipendente e slegata da informatica e statistica soltanto nel 2001, quando William Clevaland stabilì i campi di competenza della data science, inscrivendoli in 6 diverse aree: ricerca multidisciplinare, modelli, elaborazione dati, pedagogia, valutazione degli strumenti e teoria[7].

Con l'avvento dei big data e dell'idea di "valore del dato" propria di questo paradigma, evolve il concetto stesso di data science, che diviene così una scienza olistica, il quale principio fondante non è la mera gestione del dato, ma una più ampia valorizzazione della grande mole eterogenea di dati proveniente dalle diverse fonti (data warehouse, sensori, web, ecc...). La data science al giorno d'oggi va quindi intesa come una disciplina trasversale a cui fanno capo sia le sfere dell'informatica, della statistica e della matematica, come nell'accezione originale, sia un set di competenze più manageriali e astrattive, legate alla più recente necessità di sapere leggere, interpretare e capitalizzare i dati a fini di business.

L'Osservatorio Big Data Analytics & Business Intelligence del Politecnico di Milano nel 2018 ha svolto un’analisi delle offerte di lavoro pubblicate su Linkedin individuando le figure professionali più richieste in ambito data science dalle aziende. Da quest'analisi è possibile individuare almeno tre tipi di profili professionali distinti: il Data Scientist, il Data Engineer e il Data Analyst.[8]

Note

  1. ^ (EN) Foster Provost e Tom Fawcett, Data Science and its Relationship to Big Data and Data-Driven Decision Making, in Big Data, vol. 1, n. 1, 13 febbraio 2013, pp. 51–59, DOI:10.1089/big.2013.1508. URL consultato il 27 agosto 2017.
  2. ^ Vasant Dhar, Data Science and Prediction, in Commun. ACM, vol. 56, n. 12, dicembre 2013, pp. 64–73, DOI:10.1145/2500499. URL consultato il 27 agosto 2017.
  3. ^ Data Scientist: The Sexiest Job of the 21st Century, in Harvard Business Review. URL consultato il 27 agosto 2017.
  4. ^ Andrea De Mauro, Marco Greco e Michele Grimaldi, Human resources for Big Data professions: A systematic classification of job roles and required skill sets, in Information Processing & Management, DOI:10.1016/j.ipm.2017.05.004. URL consultato il 27 agosto 2017.
  5. ^ Peter Naur, The science of datalogy, in Communications of the ACM, vol. 9, n. 7, 1966.
  6. ^ Peter Naur, Concise Survey of Computer Methods, Studentlitteratur, 1974.
  7. ^ William S. Cleveland, Data science: An action plan for expanding the technical areas of the field of statistics, in International Statistical Review, 2001.
  8. ^ Data Science: i must have per la gestione dei Big Data, su blog.osservatori.net.

Voci correlate

Big Data

Big Data Analytics

Analisi dati

Altri progetti

  Portale Statistica: accedi alle voci di Wikipedia che trattano di statistica