Database incerto
Un database incerto [1] è un tipo di database studiato nell'ambito della teoria dei database. L'obiettivo dei database incerti è quello gestire le informazioni sulla cui correttezza esiste un certo grado di incertezza. I database incerti consentono di rappresentare e gestire in modo esplicito l'incertezza sui dati, solitamente in modo succinto.
Definizione formale
[modifica | modifica wikitesto]I database incerti si fondano sul concetto di mondo possibile. In particolare, un mondo possibile di un database incerto è un database (certo) che rappresenta una delle possibili realizzazioni del database incerto. Un database incerto ha in genere più mondi possibili, potenzialmente anche infiniti.
Un formalismo per rappresentare database incerti stabilisce, quindi, come rappresentare in modo succinto l'insieme di mondi possibili legati a un database incerto.
Tipi di database incerti
[modifica | modifica wikitesto]I modelli di database incerti differiscono per il modo in cui essi rappresentano e quantificano i mondi possibili:
- I database incompleti [2][3] costituiscono una rappresentazione compatta dell’insieme dei mondi possibili: l’uso di NULL in SQL, probabilmente l’istanziazione più comune nei database incerti, è un esempio di modello di rappresentazione dell'incompletezza in un database incompleto.
- I database probabilistici [4] forniscono una rappresentazione compatta di una distribuzione di probabilità sull'insieme dei mondi possibili.
- I database fuzzy [5] costituiscono una rappresentazione compatta di un insieme fuzzy dei mondi possibili.
Sebbene siano stati studiati principalmente nell'ambito del modello relazionale, i modelli di database incerti possono essere definiti anche nell'ambito di altri modelli come i database a grafo [6] o i database XML .
Database incompleto
[modifica | modifica wikitesto]Il modello relazionale rappresenta il modello di database più comune. Sono stati definiti vari modelli di database incompleti basati sul modello relazionale che costituiscono estensioni dell'algebra relazionale. Tali estensioni sono state chiamate [7] algebre di Imieliński-Lipski:
Esempio
[modifica | modifica wikitesto]La tabella seguente è una relazione di un database incompleto, descritto attraverso il formalismo dei valori nulli:
id | Nome | Stipendio |
---|---|---|
1 | Alice | 10.000 |
2 | Bobo | NULL |
3 | Carlo | NULL |
Esistono infiniti mondi possibili per questo database incompleto, ottenuti sostituendo i valori nulli con valori concreti. Ad esempio, la seguente relazione è un mondo possibile:
id | Nome | Stipendio |
---|---|---|
1 | Alice | 10.000 |
2 | Bobo | 8.000 |
3 | Carlo | 12.000 |
Note
[modifica | modifica wikitesto]- ^ (EN) Managing and Mining Uncertain Data, Advances in Database Systems, vol. 35, 2009, DOI:10.1007/978-0-387-09690-2, ISBN 978-0-387-09689-6, ISSN 1386-2944 .
- ^ (EN) vol. 31, DOI:10.1145/1634.1886, ISSN 0004-5411 , https://dl.acm.org/doi/10.1145/1634.1886.
- ^ Serge Abiteboul, Richard Hull e Victor Vianu, Foundations of Databases, Addison-Wesley, 1995, ISBN 0-201-53771-0.
- ^ (EN) DOI:10.1007/978-3-031-01879-4, ISBN 978-3-031-00751-4, ISSN 2153-5418 , https://link.springer.com/book/10.1007/978-3-031-01879-4.
- ^ (EN) vol. 5, DOI:10.1007/978-1-4613-1319-9, ISBN 978-1-4612-8566-3, ISSN 1382-3434 , https://link.springer.com/book/10.1007/978-1-4613-1319-9.
- ^ (EN) DOI:10.1007/978-3-031-01860-2, ISBN 978-3-031-00732-3, ISSN 2153-5418 , https://link.springer.com/book/10.1007/978-3-031-01860-2.
- ^ Todd J. Green, Grigoris Karvounarakis e Val Tannen, Proceedings of the twenty-sixth ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems, PODS '07, Association for Computing Machinery, 11 giugno 2007, pp. 31–40, DOI:10.1145/1265530.1265535, ISBN 978-1-59593-685-1.
- ^ a b (EN) Tomasz Imieliński e Witold Lipski, Incomplete Information in Relational Databases, in Journal of the ACM, vol. 31, n. 4, 20 settembre 1984, pp. 761–791, DOI:10.1145/1634.1886, ISSN 0004-5411 .