Open Archives Initiative Protocol for Metadata Harvesting
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting o Protocollo per il raccoglimento dei metadati dell'Open Archive Initiative) è un protocollo sviluppato dall'Open Archives Initiative come infrastruttura di comunicazione per l'Open access. È utilizzato per raccogliere (o collezionare) i metadati dei documenti in un archivio affinché i servizi possano essere costruiti utilizzando metadati da più archivi. Una implementazione dell'OAI-PMH deve supportare metadati rappresentati in Dublin Core, ma può supportare altre rappresentazioni.
Il protocollo è spesso chiamato semplicemente protocollo OAI.
OAI-PMH utilizza XML su HTTP. La versione corrente è la 2.0, aggiornata nel 2002.
Storia
[modifica | modifica wikitesto]Alla fine degli anni novanta, Herbert Van de Sompel, dell'Università di Gand, stava lavorando con ricercatori e bibliotecari nei Laboratori Nazionali di Los Alamos (US) e istituì un incontro per evidenziare le difficoltà relative ai problemi di interoperabilità dei server e-print e degli archivi digitali. L'incontro si tenne a Santa Fe, Nuovo Messico, nell'ottobre 1999. Uno sviluppo chiave raggiunto dall'incontro fu la definizione di un'interfaccia che permise ai server e-print di esporre i metadati per gli articoli contenuti in maniera che altri archivi potessero identificare e copiare gli articoli di interesse, in maniera reciproca. Questa interfaccia fu chiamata la "Convenzione di Santa Fe".
Diversi workshops furono tenuti nel 2000 presso l'ACM Digital Libraries conference[1] e altrove per condividere le idee nate con la Convenzione di Santa Fe. Si scoprì durante i workshop che i problemi affrontati dalla comunità e-print erano condivisi anche da biblioteche, musei, editori, e tutti gli altri enti o istituzioni incaricati della condivisione di risorse. Per risolvere queste necessità, la Coalition for Networked Information[2] e la Digital Library Federation[3] fornirono il finanziamento per fondare la Open Archives Initiative (OAI), sotto la direzione di Herbert Van de Sompel e Carl Lagoze. L'OAI tenne un incontro alla Cornell University (Ithaca) nel settembre 2000 per migliorare l'interfaccia sviluppata alla Convention di Santa Fe. Le specifiche furono revisionate via e-mail.
L'OAI-PMH versione 1.0 fu presentato al pubblico nel gennaio 2001 ad un workshop a Washington, e ad un altro nel febbraio dello stesso anno a Berlino. Successive modifiche allo standard XML da parte del W3C richiesero piccoli interventi all'OAI-PMH, portando alla versione 1.1. La versione attuale, 2.0, è stata pubblicata nel giugno 2002. Contiene diversi cambiamenti tecnici e miglioramenti, e non è retro-compatibile.
Il protocollo
[modifica | modifica wikitesto]L'OAI-PMH fornisce un framework di interoperabilità, indipendente dall'applicazione, basata sul raccoglimento dei metadati. Vi sono due classi di partecipanti nel framework di OAI-PMH:
- I fornitori di dati (data providers) amministrano i sistemi che supportano l'OAI-PMH come un mezzo per poter esporre i metadati
- I fornitori di servizi (service providers) usano i metadati raccolti attraverso l'OAI-PMH come base per costruire servizi di valore aggiunto[4]
Interrogazioni
[modifica | modifica wikitesto]- Identify
- GetRecord
- ListIdentifiers
- ListMetadataFormats
- ListRecords
- ListSets
Archivi OAI
[modifica | modifica wikitesto]Registri OAI
[modifica | modifica wikitesto]Il protocollo OAI è stato adottato diffusamente da molte biblioteche digitali, depositi istituzionali e archivi digitali. Benché la registrazione non sia obbligatoria, è incoraggiata.
Ci sono diversi grandi registri di depositi OAI-compatibili:
- The Open Archives list of registered OAI repositories[5]
- The OAI registry at University of Illinois at Urbana-Champaign[6]
- The Celestial OAI registry[7]
- Eprint's Institutional Archives Registry[8]
- The European Guide to OAI-PMH compliant repositories in the world[9]
- A worldwide service and registry[10]
Archivi
[modifica | modifica wikitesto]Il protocollo è supportato da un grande numero di archivi digitali, fra cui arXiv e il CERN Document Server.
Usi
[modifica | modifica wikitesto]I motori di ricerca commerciali hanno iniziato ad usare OAI-PMH per raccogliere ulteriori risorse. Google usa OAI-PMH per raccogliere informazioni dal National Library of Australia Digital Object Repository[11]. Google ha integrato OAI-PMH come parte del suo Sitemap Protocol fino al 2008[12]. Nel 2004, Yahoo! ha acquisito il contenuto di OAIster (University of Michigan) che era stato ottenuto tramite la raccolta di metadati con OAI-PMH.
Il progetto mod oai utilizza OAI-PMH per esporre ai web crawlers i contenuti accessibili dai Server Web Apache.
Software
[modifica | modifica wikitesto]OAI-PMH è basato su una architettura client-server, nella quale gli "harvester" richiedono ai "repositories" le informazioni sui record aggiornati. La richiesta dei dati può basarsi su un range di "datestamp", e può essere ristretta a domini specifici definiti dal provider. I data provider devono fornire metadati in XML nel formato Dublin Core, ma possono anche fornire diversi altri formati XML.
Un buon numero di software supporta il protocollo OAI-PMH:
- Invenio[13] del CERN
- Fedora Commons
- GNU EPrints dell'Università di Southampton
- Open Journal Systems (OJS) del Public Knowledge Project
- Desire2Learn
- DSpace del MIT
- HyperJournal dell'Università di Pisa
- Primo, DigiTool, Rosetta e MetaLib di Ex Libris[14]
- DOOR[15] dell'eLab[16] di Lugano
- L'implementazione java jOAI[17].
Workshop
[modifica | modifica wikitesto]Ogni anno, dal 2001, l'Open Archive Initiative tiene un workshop al CERN di Ginevra.
Note
[modifica | modifica wikitesto]- ^ ACM Digital Libraries conference
- ^ Coalition for Networked Information
- ^ Digital Library Federation
- ^ The Open Archives Initiative Protocol for Metadata Harvesting
- ^ The Open Archives list of registered OAI repositories
- ^ The OAI registry at University of Illinois at Urbana-Champaign Archiviato il 1º ottobre 2015 in Internet Archive.
- ^ The Celestial OAI registry
- ^ Eprint's Institutional Archives Registry
- ^ Openarchives.eu The European Guide to OAI-PMH compliant repositories in the world
- ^ ScientificCommons.org A worldwide service and registry
- ^ National Library of Australia Digital Object Repository Archiviato il 27 gennaio 2020 in Internet Archive.
- ^ Google Webmaster blog
- ^ Invenio
- ^ Ex Libris
- ^ DOOR
- ^ eLab
- ^ jOAI
Bibliografia
[modifica | modifica wikitesto]- Carl Lagoze and Herbert Van de Sompel, The Open Archives Initiative: Building a Low-Barrier Interoperability Framework, in Proceedings of the first ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL'01), 2001, pp. 54-62.
- Lynch, Clifford A. (2001). "Metadata harvesting and the open archives initiative". ARL Bimonthly Report 217.
- Frank McCown, Xiaoming Liu, Michael L. Nelson and Mohammed Zubair, Search Engine Coverage of the OAI-PMH Corpus, in IEEE Internet Computing, vol. 10, n. 2, marzo/aprile 2006, pp. 66–73.
- Herbert Van de Sompel and Carl Lagoze, [https://dx.doi.org/10.1045/february2000-vandesompel-oai The Santa Fe Convention of the Open Archives Initiative], in D-Lib Magazine, vol. 6, n. 2, 2000, DOI:10.1045/february2000-vandesompel-oai.
- Herbert Van de Sompel, Jeffrey A. Young, and Thomas B. Hickey, [https://dx.doi.org/10.1045/july2003-young Using the OAI-PMH ... Differently], in D-Lib Magazine, vol. 9, n. 7/8, 2003, DOI:10.1045/july2003-young.
Voci correlate
[modifica | modifica wikitesto]- Data format management
- Digital curation
- Preservazione digitale
- Formato di file
- Dublin Core, uno standard metadata ISO
- National Digital Information Infrastructure and Preservation Program
- METS
- LOCKSS
- Web archiving
Collegamenti esterni
[modifica | modifica wikitesto]- (EN) Specifiche del protocollo, su openarchives.org.
- (EN) Suleyman Demirel University Open Archives Harvester, su oai.sdu.edu.tr. URL consultato il 16 marzo 2010 (archiviato dall'url originale il 14 marzo 2010).
- (EN) National Library of Congress, Digital Collections and Programs, su loc.gov.
- (EN) Library of Congress, National Digital Information Infrastructure and Preservation Program, su digitalpreservation.gov.
- (EN) Library of Congress, Web Capture, su loc.gov.