Wikipedia:Bar/Discussioni/Report incontro Wikimedia Italia - BNCF

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Report incontro Wikimedia Italia - BNCF


Cari Wikipediani,
sabato 29 giugno 2013, si è svolto a Firenze un incontro tra Wikimedia Italia (WMI) ed alcuni funzionari della Biblioteca Nazionale Centrale di Firenze (BNCF) per discutere di alcuni progetti comuni. Pensavamo fosse utile per tutti pubblicare anche qui il report della giornata, dato che si parla di alcune questioni inerenti a Wikipedia.

Durante l'incontro sono stati discussi diversi progetti:

  • Wikipedia - Thesauro del Nuovo Soggettario (NS)
  • altre fonti dati BNCF per Wikidata
  • classificazione Dewey dei libri su Wikidata/Wikipedia
  • lettera di intenti WMI - BNCF
  • corso su Wikipedia in BNCF
  • scansioni di libri nel Pubblico Dominio per Wikisource
  • Wiki Loves Monuments

Progetto Wikipedia - Thesauro del Nuovo Soggettario[modifica wikitesto]

È stato fatto il punto della situazione del progetto Wikipedia - Thesauro del Nuovo Soggettario. Su Wikipedia, dopo una discussone con la comunità sono stati inseriti tramite bot i “backlink” tra le schede dei termini del Thesauro e le pagine di Wikipedia. Ora in Wikipedia il template {{Thesaurus BNCF}} è presente in 7555 voci (si veda il conteggio), mentre i termini del Thesaurus sono in totale 47800.

Sono stati condivisi con noi due documenti contenenti:

  • le statistiche sui collegamenti Thesaurus - Wikipedia
  • la descrizione della procedura per la creazione automatica dei link.

L’idea è, da parte della BNCF di espandere la “copertura” del Thesaurus (in termini di numero di link Thesaurus -> Wikipedia) dall'altro quello di usare Wikidata e Wikipedia come “feedback” sulla correttezza di questi link.

Classificazione Dewey su Wikidata[modifica wikitesto]

La proprietà “Classificazione decimale Dewey” era stata proposta su Wikidata ma è stata al momento sospesa per questioni di copyright (la classificazione è proprietaria). Il personale della BNCF ci ha indicato che inserire la classificazione su un item è possibile, ma non è possibile è riprodurre la struttura gerarchica/classificatoria dello strumento. Quindi la discussione è stata riaperta.

Attendiamo comunque dal personale BNCF che ci diano notizie più aggiornate e specifiche sull’effettiva usabilità della classificazione.

Lettera di intenti WMI - BNCF[modifica wikitesto]

Dopo aver rivisti i risultati e le nuove prospettive del progetto precedente si è proposto di formalizzare questa attività sottoscrivendo una lettera di intenti "aperta" tra WMI e la BNCF. La lettera sarà aperta nel senso che non riguarderà solo il progetto "Thesauro", ma anche altre possibili collaborazioni. Giovanni Bergamin invierà una bozza di lettera.

Scansioni in Pubblico Dominio per Wikisource[modifica wikitesto]

Il Ministero per i Beni e le Attività Culturali (MiBAC) ha siglato un accordo con Google per la digitalizzazione delle opere contenute nelle Biblioteca Nazionale Centrale di Roma e Firenze.

Pare che l’accordo non preveda alcuna restrizione sule scansioni delle opere in Pubblico Dominio, ma solo un generico diritto di database e quindi le opere potrebbero essere scaricate da Google Books e utilizzate su Wikisource. Cercheremo di investigare la percorribilità di questa strada.

Wiki Loves Monuments[modifica wikitesto]

La BNCF si trova a Firenze in piazza dei Cavalleggeri, all'interno di un edificio monumentale (si veda la voce sulla BNCF), cercheremo di capire chi può concedere l'autorizzazione affinché l'edificio possa essere inserito nella lista dei monumenti fotografabili per Wiki Loves Monuments 2013.

Saluti, CristianCantoro e Aubrey --14:53, 15 lug 2013 (CEST)[rispondi]


Accordi con Google[modifica wikitesto]

Ho notato che ormai se un testo in PD scannerizzato da Google e' piuttosto richiesto, spesso compare tra quelli visibili e/o completamente scaricabile, e viceversa compaiono ristampe "anagrafiche' a pagamento da editori varie pdf a pagamento. Ho la vaga impressione che "qualcuno" faccia il furbo dopo l'accordo.--Bramfab Discorriamo 18:57, 15 lug 2013 (CEST)[rispondi]

(non ho capito bene a cosa ti riferisci, Bramfab) -- CristianCantoro - Cieli azzurri! (msg) 19:10, 15 lug 2013 (CEST)[rispondi]
La mia esperienza è che Google tolga dai testi di google Books totalmente scaricabili quelli per cui possa esserci concorrenza. Per cui non è così strano un meccanismo: Linko un testo di PD, la gente lo visita, qualcuno decide di ristamparlo (magari on-demand), Google lo toglie per non fare concorrenza. Google è una società privata e ha tutto il diritto di farlo, così come chiunque (compreso Wikisource) ha diritto di pubblicare un libro di pubblico dominio. --Cruccone (msg) 21:30, 15 lug 2013 (CEST)[rispondi]
Vorrei capire il contenuto e sopratutto lo spirito con cui biblioteche gli hanno concesso di digitalizzare i libri.
Per esempio credo che la BNCF desideri che i suoi libri siano disponibili in PD senza costi una volta digitizzati e messi in rete, o quantomeno tali rimangano i file generati dall'accordo.
Oppure organizzarsi per prelevarli subito quando messi in rete e portarli subito in wikisource o web.archive.
--Bramfab Discorriamo 22:23, 15 lug 2013 (CEST)[rispondi]
servirebbe il testo dell'accordo perché le dichiarazioni programmatiche impegnano il privato (BigG) - a quel che leggo qui - solo per la scansione; sicuramente c'è anche un impegno al servizio di mantenere online i testi, ma bisognerebbe appunto leggere il testo dell'accordo. Stanti però le premesse programmatiche del MIBAC, e considerato che sarebbe quantomeno il minimo dell'educazione, dopo la scansione, rendere all'Ente almeno una copia digitalizzata (e spero bene che si restituisca il libro "di carta"...), ci si può certo disporre a richiedere all'Ente una copia in digitale, e noi possiamo sì impegnarci ad una garanzia di visibilità nei ragionevoli termini delle nostre impostazioni finanziarie.
Nella pratica, non so se in concreto si sia poi fatto qualcosina di più di questo, o se qualcosa ci sia qui, certo che se l'accordo è per la Divina Commedia, che tutto può essere meno che difficile da procacciarsi, non siamo andati molto avanti. Ma è una strada che credo sia da percorrere, quella dell'accordo con gli enti, ci credo da tempo (SGI) e i tempi oggi sono maturi. Noi non possiamo impegnarci per le scansioni, per le quali serve sempre un soggetto terzo che al tempo si pensava potesse trovarsi ricorrendo alle università.
Quanto agli interessi che ruotano intorno alle anastatiche, devo confessare che io - quelle su carta - le ho sempre comprate con piacere, anche perché spesso le fanno piccolissime aziendine locali che con molta buona volontà e pochi mezzi perpetuano la disponibilità di testi che altrimenti non si troverebbero nemmeno in un grande bric-à-brac. In quel senso, e soprattutto perché poi si ri-diffondono opere di letterature minori e locali, con gran rilievo della poesia popolare (tutta roba non ency :-), non ho mai guardato col cipiglio a queste operazioni, quindi auguri, possano crescere e far ogni giorno di meglio. Del resto, dato che uso le nostre licenze con consapevolezza, non me la prendo nemmeno con chi fa operazioni di questo tipo. In fondo lavoriamo anche per questo :-) -- g · ℵ (msg) 00:11, 16 lug 2013 (CEST)[rispondi]

(rientro) Ricordiamoci comunque che google libri ridistribuisce i testi in PD con una licenza che non permette l'uso commerciale ("Non fare un uso commerciale di questi file Abbiamo concepito Google Ricerca Libri per l’uso da parte dei singoli utenti privati e ti chiediamo di utilizzare questi file per uso personale e non a fini commerciali."). Poi noi possiamo discutere se questo limite e' legale e/o moralmente corretto per opere ormai testuali in PD (fossero opere grafiche solo il fatto di riprodurle sul territorio italiano dovrebbe tutelare per 20 anni la riproduzione, per cui per es eventuali illustrazioni presenti potrebbero non essere usabili in Italia), ma non mi stupirei se google avesse comunque esplicitato nell'accordo con le biblioteche che i testi non saranno comunque utilizzabili commercialmente.--Yoggysot (msg) 09:01, 16 lug 2013 (CEST)[rispondi]

Mi sembra di ricordare che Commons non riconosce qualcosa che in legalese anglofono viene detto "sudore della fronte" o simile per l'utilizzo di materiale ormai in PD da qualunque fonte provenga (non ho tempo per ricercare i dettagli e la denominazione esatta).
Anche a me piacciano le anastatiche, e non ho niente in contrario verso chi le stampa e le vende, tuttavia se posso avere il file alla lunga evito di uscite di casa per far posto alla carta (ormai siamo a questi livelli) , e se il file e' stato prodotto da materiale messo a disposizione dietro uno spirito di diffusione del sapere ormai libero a seguito di una richiesta che apparentemente segue questa filosofia, mi girano i cosiddetti nel vedere che poi qualcuno ne approfitta facendolo il file ed usando piccole preview giusto per ingolosire i potenziali acquirenti. --Bramfab Discorriamo 11:53, 16 lug 2013 (CEST)[rispondi]
@CristianCantoro: c' e' un piccolo dettaglio tecnico, se possiamo dare suggerimenti alla BNCF: quasi sempre i libri digitizzati da Google hanno scannerizzato alla cavolo le tavole, in essi contenuti, se le loro dimensioni sono maggiori delle pagine del libro, ovvero quelle tavole piegate in due, in quattro, a fisamornica, ecc. Si tratta spesso di mappe, tavole e disegni tecnici il cui valore documentario spesso e' superiore al testo, ma che non vengono aperte durante l'operazione, per cui la loro scannerizzazione non serve a niente. Se fosse possibile farlo notare ...--Bramfab Discorriamo 12:00, 16 lug 2013 (CEST)[rispondi]
Se non ho capito male una copia delle scansioni sarà fornita alle due biblioteche,quindi immagino che potranno farne quello che vogliono, anche caricarle tutte su Wikisource o WIkibook: "Google fornirà inoltre alle due biblioteche le copie digitali di ciascun libro parte del progetto, così che possano a loro volta renderli disponibili anche su piattaforme diverse da Google Books, quali, ad esempio, quella del progetto Europeana" --ValterVB (msg) 13:11, 16 lug 2013 (CEST)[rispondi]

Al momento, noi non abbiamo ancora visto il testo dell'accordo con Google, e sono d'accordo con tutti che sarebbe molto importante vederlo. Proveremo a chiederglielo. Entrando nel merito, e avendoci sbattuto la testa più di una volta, posso dirvi la mia opinione (IANAL, eh), che riassumo in due punti:

  • la status legale delle scansioni di libri in pubblico dominio non è chiara.
  • il copyright è proporzionale ai soldi che puoi permetterti nel pagare un avvocato.

Come ricordava Bramfab, lo "sweat of the brow" non è riconosciuto in moltissimi stati (fra cui l'Italia). Questo vuol dire che una foto può avere (in Italia) quattro livelli di copyright (qui si parla di 3).

In pratica, una scansione di una pagine non dovrebbe generare un nuovo copyright, per quanto professionale sia. E "quello che è in PD rimane in PD", e questa è anche la posizione della Foundation. Assieme a lei, anche Commons accetta libri di Google Books (le Wikisource sono piene) e Internet Archive, per quanto non ufficialmente, ha un bot che carica automaticamente da GB a IA (infatti, dopo un po', su GB le cose "spariscono").

Il fatto è che questa posizione piace a tutti noi corsari dell'open, mentre le biblioteche, da sempre, appongono il loro bel "Tutti i diritti riservati", ovunque (anche nella biblioteca digitale dove lavoro io). Non so cosa direbbe un giudice se qualcuno prendesse quelle immagini e le vendesse (nessuno, che io sappia, è andato in tribunale, anche se ci sono fastidiosi casi limite: se io biblioteca pago te fotografo per farmi delle scansioni, e tu ti rivendi i TIF non compressi per la stampa, ne hai il diritto o no?).

Quelli della BNCF, alle nostre domande sono rimasti sulla prima opzione: la roba è in pubblico dominio e tutto. Google si riserva l'unica diritto possibile, che è quel "diritto di database", riconosciuto anche a livello europeo, per aver organizzato il tutto. Se noi riuscissimo ad avere i file direttamente dalla BNCF, come spero, non dovremmo avere problemi di sorta. --Aubrey McFato 15:20, 17 lug 2013 (CEST)[rispondi]