Preservazione digitale

Da Wikipedia, l'enciclopedia libera.

La preservazione digitale è la conservazione di informazioni digitali nel tempo. La preservazione digitale può essere vista come un insieme dei processi e delle attività che assicurano un accesso continuo alle informazioni e a tutti tipi di registrazioni, e eredità scientifiche culturali in formato digitale. Questo include la preservazione di materiali dal digital reformatting, e in particolare di informazioni nate sotto forma digitale e senza una controparte analoga in forma cartacea. Nel linguaggio delle immagini digitali e delle risorse elettroniche, la preservazione non risulta più essere soltanto il prodotto di un programma ma un processo in continua evoluzione. In questo ambito l'informazione digitale è conservata affinché sia assicurata una sua longevità nel tempo. la conservazione a lungo termine di informazioni digitali è assistita dall'inclusione di metadata di preservazione.

La preservazione digitale è definita come tale solo quando è a lungo termine e sicura da eventuali errori di conservazione per eventuali recuperi delle stesse informazioni per tutto il periodo in cui informazione è conservata.

Le eredità culturali della società umana possono essere conservate sotto diverse forme materiali come la pietra, la pergamena, il bambù, la carta, eccetera. In questa era una grande quantità di informazioni esiste in forma digitale come i siti di news, i blog, i siti di social networking, i siti di conservazione di immagini e siti che cambiano il loro contenuto nel tempo. Secondo dati riportati da Brewster Kahle, fondatore nel 1996 di Internet Archive, nell'articolo Preserving the Internet pubblicato su Scientific American nel 1998, la durata media di una URL era di 44 giorni.[1]

La caratteristica unica di un'informazione in forma digitale fa sì che il suo contenuto possa essere facilmente aggiornato ma allo stesso tempo comporta molte difficoltà nella sua preservazione nel tempo.

Deterioramento fisico[modifica | modifica sorgente]

Il primo problema affrontato nella preservazione di dati digitali risiede sul fatto che i media, nei quali sono conservate le informazioni, sono più vulnerabili al deterioramento e a catastrofi naturali. La carta si deteriora in termini di brillantezza e di coloritura, ma questo stesso deterioramento diviene visibile dopo almeno 10 decenni; e quando il deterioramento avviene realmente, esso viene solo molte decadi dopo. È anche possibile recuperare tutte le informazioni senza alcuna perdita anche dopo che il deterioramento è comparso. I dati registrati in forma digitale si deteriorano in molto meno tempo, una volta che il deterioramento è cominciato in molti casi i dati sono irrimediabilmente persi. Questa caratteristica dei dati digitali lascia molto poco tempo tra la decisione di una preservazione degli stessi dati e la messa in atto della preservazione.

Obsolescenza digitale[modifica | modifica sorgente]

Exquisite-kfind.png Per approfondire, vedi obsolescenza digitale.

Un altro problema, forse anche più serio ed importante, è il problema dell'accesso a lungo termine. La tecnologia digitale si sta sviluppando in modo molto veloce e il modo di recuperare informazioni digitali può risultare obsoleto in pochi anni. Quando un software o una tecnologia per la decodifica di un'informazione digitale viene abbandonata oppure l'hardware sul quale l'informazione è conservata non è più disponibile, le informazioni registrate possono essere facilmente perdute semplicemente perché non sono più raggiungibili. Questo processo è conosciuto anche come obsolescenza digitale (digital obsolescence).

Questo problema è dovuto alla mancanza di standard, protocolli e metodi di conservazione digitale stabiliti [2]. In passato abbiamo conservato copie dei dati su nastri ma gli standard per questa tecnologia sono cambiati enormemente negli ultimi anni e non c'è alcuna garanzia che questi stessi nastri siano leggibili nel futuro[3].

Strategie[modifica | modifica sorgente]

Vi sono diversi tipi di strategia per la preservazione di dati digitali nel tempo.

Refreshing[modifica | modifica sorgente]

Il refreshing è il trasferimento di dati tra due supporti digitali dello stesso tipo; in questo modo non ci sono cambi o alterazioni della rappresentazione binaria dei dati [4]. Per esempio, il trasferimento di dati del censimento di una popolazione da un compact disc ad un altro. Questa strategia deve essere combinata con quella della migrazione quando il software del computer o l'hardware richiesto per leggere i dati non è più disponibile o non adatto a leggere il formati dei dati stessi. La strategia del "refreshing" può diventare necessaria nei casi di deterioramento fisico del supporto.

Migrazione[modifica | modifica sorgente]

La migrazione è il trasferimento dei dati su un nuovo sistema anche su supporti digitali diversi. Questa strategia può comportare la conversione delle risorse da un formato a un altro (per esempio la conversione di un documento Word ad uno PDF o OpenDocument), da un sistema operativo ad un altro (ad esempio da Solaris a Linux) o da un linguaggio di programmazione ad un altro (ad esempio dal linguaggio C a Java) in modo che la risorsa resti pienamente accessibile e funzionale. I dati che hanno subito il processo di migrazione corrono il rischio di perdere alcuni tipi di funzionalità con i nuovi formati sono incapaci di lavorare o leggere, oppure il convertitore o programma utilizzato per la conversione può essere incapace di interpretare tutte le particolarità del formato originale. National Archives and Records Administration e Lockheed Martin stanno sviluppando un sistema di migrazione dei dati che preserverà qualsiasi tipo di documento, creato con ogni applicazione o su ogni piattaforma o con qualsiasi tipo di media digitale. Con questo tipo di sistema i file sono trasformati in formati flessibili, come l'XML; essi saranno perciò accessibili facilmente da nuove tecnologie in futuro. Lockheed Martin ritiene che sarà impossibile sviluppare un sistema di emulazione per gli archivi del National Archives and Records Administration perché il volume dei dati ed il costo sarebbero eccessivi.

Duplicazione[modifica | modifica sorgente]

La duplicazione (replication) è la creazione di copie dei dati su più sistemi. I dati che sono disponibili in singola copia su un solo sistema sono soggetti al rischio di crash del software che li fa girare o dell'hardware, di alterazione intenzionale o accidentale, o di catastrofi ambientali quali incendi, allagamenti, ecc. Attraverso la duplicazione su più sistemi in posti differenti i dati hanno molta più possibilità di mantenersi integri.

Emulazione[modifica | modifica sorgente]

Exquisite-kfind.png Per approfondire, vedi emulatore.

L'emulazione è la duplicazione delle funzionalità di un sistema obsoleto. Per esempio l'emulazione di Atari 2600 su un sistema Windows o l'emulazione di WordPerfect 1.0 su un sistema Macintosh. Gli emulatori possono essere creati per applicazioni, sistemi operativi o piattaforme hardware. L'emulazione è stata una strategia popolare per riportare in funzione videogiochi di vecchie piattaforme, come per esempio il progetto MAME. La flessibilità dell'emulazione come sistema universale è stata dibattuta dalla comunità accademica. Raymond A. Lorie ha suggerito la creazione di un Universal Virtual Computer (computer virtuale universale) che potrebbe far girare qualsiasi software in futuro su qualsiasi piattaforma ancora sconosciuta o non ancora creata. Questa strategia non è stata adottata in modo massiccio dalla comunità.

Utilizzo dei Metadati[modifica | modifica sorgente]

Exquisite-kfind.png Per approfondire, vedi metadato.

I metadati sono dati incorporati in un file digitale che includono informazioni sulla creazione, diritti di accesso, restrizioni di accesso, storia di preservazione e diritti per l'uso[5]. I metadati possono subire la obsolescenza. ASCII è considerato il formato più durevole per i metadati [6] perché è largamente diffuso, retrocompatibile quando usato con Unicode, e utilizza caratteri leggibili, non codici numerici. Esso contiene nel tempo l'informazione ma non la struttura con la quale l'informazione è presentata. Per maggiori funzionalità possono essere usati anche SGML o XML. Entrambi questi linguaggi sono conservati in formato ASCII ma contengono tag che denotano struttura e formato.

Oggetti digitali certificati[modifica | modifica sorgente]

Gli oggetti digitali che possono garantire la loro stessa autenticità sono chiamati oggetti digitali certificati. Essi furono proposti da Henry M. Gladney per permettere agli oggetti digitali di mantenere una cronologia dei loro cambiamenti così da permettere ai futuri utenti di essere certi che i contenuti degli oggetti sono autentici (Gladney, 2004). Altre strategie di preservazione come la duplicazione e la migrazione sono necessarie per la conservazione a lungo termine della certificazione.

Sostenibilità digitale[modifica | modifica sorgente]

La sostenibilità digitale comprende una serie di questioni e problematiche riguardanti la longevità delle informazioni digitali. [7] A differenza delle strategie e delle soluzioni tradizionali, sia quelle a breve termine che a lungo termine, la sostenibilità digitale implica un metodo di conservazione più attivo e continuo. La sostenibilità digitale si concentra meno sulla soluzione e sulla tecnologia e più sulla costruzione di una infrastruttura e su un approccio ad essa che sia flessibile, con una particolare attenzione in materia di interoperabilità, manutenzione e sviluppo continui. [8] La sostenibilità digitale incorpora metodi applicati nel presente che facilitano l'accesso e la disponibilità del materiale digitale nel futuro più o meno lontano.

Standard di conservazione digitale[modifica | modifica sorgente]

Exquisite-kfind.png Per approfondire, vedi Open Archival Information System.

Per standardizzare la pratica della preservazione digitale e fornire un insieme di raccomandazioni per l'attuazione del programma di conservazione, è stato sviluppato il modello di riferimento per un sistema aperto di informazioni sull'archiviazione (Open Archival Information System, OAIS) . Il modello di riferimento (ISO 14721:2003) include le seguenti direttive che un archivio OAIS dovrebbe rispettare:

  • Negoziare e scambiare informazioni appropriate con i produttori dei dati digitali
  • Ottenere un sufficiente controllo delle informazioni fornite ad un livello che garantisca la conservazione a lungo termine.
  • Determinare quale comunità dovrebbe diventare "comunità di riferimento" in grado di comprendere le informazioni fornite.
  • Assicurarsi che le informazioni digitali da conservare siano comprensibili in modo autonomo per la comunità di riferimento. In altre parole, la comunità dovrebbe essere in grado di comprendere le informazioni anche senza l'aiuto degli esperti che hanno prodotto l'informazione.
  • Seguire le politiche e le procedure documentate che garantiscano che le informazioni siano conservate al riparo da tutti i rischi ragionevoli, e che consentono la diffusione delle informazioni in copia autenticata dell'originale, o riconducibile a quella originale.
  • Rendere l'informazione digitale archiviata e a disposizione della comunità di riferimento. [9].

OAIS si occupa di tutti gli aspetti tecnici del ciclo di vita di un oggetto digitale: l'atto dell'immissione in un archivio e lo stoccaggio nella infrastruttura di conservazione, la gestione dei dati, l'accessibilità e la distribuzione. Il modello si occupa anche dei problemi riguardanti i metadati e raccomanda che siano cinque i tipi di metadati da associare a un oggetto digitale: il riferimento (identificazione) dell'oggetto, la provenienza (tra cui una cronologia della conservazione), il contesto, la fissità (indicatori di autenticità), e la rappresentazione (formattazione, struttura dei file, e cosa "conferisce significato al bitstream dell'oggetto". [4]

Prima della proposta di Gladney dwgli TDO è stata il Research Library Group (RLG) a sviluppare gli "attributi e le responsabilità" che denotano la prassi di una "Trusted Digital Repository" (TDR). I sette attributi di un TDR sono: "conformità con il modello di riferimento per un Archival Open Information System (OAIS), la responsabilità amministrativa, la sostenibilità organizzativa, la sostenibilità finanziaria e tecnologica e l'adeguatezza procedurale, la sicurezza del sistema, la responsabilità di procedura". Tra le responsabilità del RLG vi sono anche le raccomandazioni per lo sviluppo di un sistema collaborativo di repository digitale, e la condivisione di ricerche e informazioni sulla preservazione digitale anche sugli aspetti che riguardano i diritti di proprietà intellettuale. [10].

Standard di preservazione di audio digitale[modifica | modifica sorgente]

Nel gennaio 2004, il Council on Library and Information Resources (CLIR) ha organizzato una riunione di esperti di audio per discutere sulle migliori pratiche di preservazione di audio digitale; la riunione culminò in un rapporto consegnato nel marzo 2006. Questo rapporto indaga sulle procedure per la riformattazione del suono da analogico a digitale e riassume le discussioni e le raccomandazioni per le migliori pratiche di conservazione digitale. Gli esperti distribuirono una serie di 15 raccomandazioni per migliorare la pratica di trasferimento del segnale audio analogico al digitale per l'archiviazione:

  • Sviluppare competenze di base nel campo dell'ingegneria della preservazione audio. I partecipanti hanno preso atto con preoccupazione che il numero di esperti qualificati per il trasferimento e l'archiviazione digitale di vecchie registrazioni audio si sta restringendo e ha sottolineato la necessità di trovare un modo per garantire che le conoscenze tecniche degli esperti possano essere condivise con le generazioni successive.
  • Sviluppare accordi con le istituzioni più piccole che consentano l'acquisto cooperativo di materiali e forniture.
  • Perseguire un programma di ricerca per i problemi riguardanti i nastri magnetici che si concentri su soluzioni meno distruttive.
  • Elaborare linee guida per il trasferimento automatizzato di audio analogico a copie digitali.
  • Sviluppare un punto di smistamento basato su un'applicazione web per la condivisione delle informazioni su come si possano sviluppare programmi di trasferimento e di preservazione digitali.
  • Realizzare progetti di ricerca ulteriori su un riproduzione non distruttiva di audiodischi danneggiati.
  • Elaborare un diagramma di flusso per identificare la composizione dei vari tipi di dischi e nastri audio.
  • Sviluppare una tabella di riferimento sulle problematiche più frequenti riguardanti i media digitali.
  • Catalogare i principali standard di ingegneria audio.
  • Studiare i metodi più sicuri ed efficaci per la pulizia di nastri e dischi analogici.
  • Sviluppare un elenco di esperti musicali che potrebbero essere consultati per un parere sul trasferimento di specifici tipi di contenuti musicali (ad esempio, determinare la chiave corretta in modo che la velocità di riproduzione migliore possa essere stabilita).
  • La ricerca sull'aspettativa di vita di vari formati audio.
  • Stabilire archivi digitali audio per regione.
  • Collaborare per sviluppare un vocabolario comune nel campo della conservazione audio.
  • Indagare sul trasferimento di tecnologie da settori come la chimica e la scienza dei materiali per risolvere i vari problemi della preservazione di reperti audio.[11]

Linee guida aggiornate sulle tecniche per la creazione e la preservazione di materiale audio digitale sono state pubblicate anche dalla International Association of Sound and Audiovisual Archives (IASA).[12]

Esempi di iniziative di preservazione digitale[modifica | modifica sorgente]

  • Xena è un software libero per l'archiviazione basato su Java che può essere installato su qualsiasi PC. Converte documenti proprietari, elementi grafici e file audio in formati aperti e normalizza gli altri file binari in ASCII con un wrapper file XML.
  • ArchivalWare costruito da PTF, Inc. è una soluzione di biblioteca digitale creata appositamente per accogliere, diffondere, conservare e consentire l'individuazione di risorse digitali. Il prodotto crea file PDF per la conservazione digitale a lungo termine e include il supporto per metadati XMP, che consente ai metadati l'incorporamento permanente con l'oggetto digitale stesso.
  • DSpace è un software open source che accetta dati digitali in diversi formati (testo, video, audio), li distribuisce attraverso il web, li indicizza (per un facile reperimento), e li conserva nel tempo.
  • La British Library è responsabile di diversi programmi nel settore della preservazione digitale. L' Archivio Nazionale del Regno Unito ha anche aperto la strada a varie iniziative nel campo della preservazione digitale.
  • SimpleDL è in grado di memorizzare più formati, inclusi testi, immagini, video, audio e dati. SimpleDL utilizza Amazon S3 per fornire il 99,999999999% di durabilità dei dati digitali conservati nel proprio archivio..

Iniziative di preservazione digitale su larga scala[modifica | modifica sorgente]

Molte biblioteche e archivi hanno iniziato o stanno per avviare iniziative di preservazione digitale di grandi dimensioni (LSDI, acronimo per la definizione in lingua inglese Large-Scale digital preservation initiatives). I principali protagonisti sono istituzioni culturali, società commerciali come Google e Microsoft, e gruppi no-profit tra cui la Open Content Alliance (OCA), il Million Book Project (MBP), e HathiTrust. La motivazione principale di questi gruppi è quella di espandere l'accesso alle risorse accademiche in una visione soprattutto a lungo termine.

Circa 30 enti culturali, tra cui i 12 membri del Committee on Institutional Cooperation (CIC, Comitato per la cooperazione istituzionale), hanno firmato accordi di digitalizzazione sia con Google che con Microsoft. Molti di questi enti culturali stanno partecipando alla Open Content Alliance (OCA) e al Million Book Project (MBP). Alcune biblioteche sono coinvolte in una sola iniziativa mentre altre hanno diversificato le loro strategie di digitalizzazione attraverso la partecipazione a molteplici iniziative. I principali motivi dichiarati per la partecipazione delle biblioteche a programmi LSDI sono: accesso, preservazione, ricerca e sviluppo. Si spera che la preservazione digitale faccia sì che materiale delle biblioteche sia ancora accessibile alle generazioni future. Le biblioteche prevedono in futuro di utilizzare copie digitalizzate come backup per le opere nel caso in cui queste escano fuori di stampa, si deteriorino, si perdano o vengano danneggiate in maniera irreparabile.

Note[modifica | modifica sorgente]

  1. ^ Brewster Kahle Preserving the Internet. «Scientific American», 276 (1997), n. 3, p. 72-74. Verificato il 5 febbraio 2011
  2. ^ Levy, D. M. & Marshall, C. C. (1995). Going digital: a look at assumptions underlying digital libraries," Communications of the ACM, 58, No. 4: 77-84.
  3. ^ Flugstad, Myron. (2007). Website Archiving: the Long-Term Preservation of Local Born Digital Resources. Arkansas Libraries v. 64 no. 3 (Fall 2007) p. 5-7
  4. ^ a b Cornell University Library. (2005) Politiche di gestione della conservazione delle collezioni digitali: Strategie a breve termine per contrastare problemi a lungo termine
  5. ^ NISO Framework Advisory Group. (2007). A Framework of Guidance for Building Good Digital Collections, 3rd edition, p. 57,
  6. ^ National Initiative for a Networked Cultural Heritage. (2002). NINCH Guide to Good Practice in the Digital Representation and Management of Cultural Heritage Materials
  7. ^ Bradley, K. (Summer 2007). Defining digital sustainability. Library Trends v. 56 no 1 p. 148-163.
  8. ^ Sustainability of Digital Resources. (2008). TASI: Technical Advisory Service for Images.
  9. ^ Consultative Committee for Space Data Systems. (2002). Reference Model for an Open Archival Information System (OAIS). Washington, DC: CCSDS Secretariat, p. 3-1
  10. ^ Research Libraries Group. (2002). Trusted Digital Repositories: Attributes and Responsibilities
  11. ^ Council on Library and Information Resources. Publication 137: Capturing Analog Sound for Digital Preservation: Report of a Roundtable Discussion of Best Practices for Transferring Analog Discs and Tapes March 2006
  12. ^ IASA (2009). Guidelines on the Production and Preservation of Digital Audio Objects

Voci correlate[modifica | modifica sorgente]

Collegamenti esterni[modifica | modifica sorgente]