Wikipedia:Bar/Discussioni/Aggiornamento semiautomatico filmografie (e discografie)

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Aggiornamento semiautomatico filmografie (e discografie)


Buongiorno, apro questa discussione con l'obiettivo di riorganizzare la gestione di Wikipedia:Convenzioni di stile/Sezioni di filmografia, che ad oggi comporta per ogni voce un lavoro manuale penoso e talvota piuttosto lungo, senza contare che va aggiornato continuamente. Non ho tuttavia una proposta già confezionata e scrivo qui anche per condividere le idee con tutti voi.

La mia idea di base consiste nel creare e far girare un bot dedicato o di servirsi di un tool per automatizzare e soprattutto standardizzare questa procedura. Il bot potrebbe prima di tutto fare un giro delle voci e applicare le convenzioni di stile e in secondo luogo inserire le informazioni mancanti. Attualmente si va a pescarle manualmente da siti esterni mentre ciò a cui stavo pensando è di centralizzare tutto su wikidata. Se guardo ad esempio Bruce Willis, su wikidata esiste già una proprietà per la filmografia (P1283) - che però ha lo scopo di collegare le pagine di filmografia - o per le opere rilevanti (P800). Non è esattamente il nostro caso e comunque andrebbero create delle nuove proprietà per suddividere i ruoli, ma è per rendere l'idea di cosa vorrei proporre.

Ho deciso di postare la conversazione qui al bar poiché la discussione coinvolge direttamente più progetti (in particolare Progetto:Cinema, Progetto:Televisione, Progetto:Coordinamento) e se fattibile impiegherebbe in ogni caso l'utilizzo di un bot su it:wiki e immagino di una controparte su wikidata (ed eventualmente di un nuovo template da creare che legga in automatico le informazioni).

Non è la prima volta e non sarà l'ultima che con i giusti mezzi e metodi potremmo facilitare di molto attività impegnative e ripetitive (Per fare un paragone, ho memoria dei tempi bui in cui non c'era alcun bot che aiutava a gestire le categorie...)

Per dare un'idea dell'entità del lavoro a chi non segue questi progetti basta che guardi le sottocategorie di Categoria:Wikificare - cinema, che tuttavia non da nemmeno il quadro completo poiché molte voci non riportano l'avviso, oppure la filmografia è formattata correttamente ma è incompleta/da aggiornare.

Nota: Inizialmente mi è balenato in testa di associare questa idea anche alla discografia di artisti musicali trattandosi di un concetto analogo (ad esempio su en:wiki vengono trattate insieme) ed è una cosa che sarei interessato a portare avanti successivamente, se sul progetto cinema funziona. Il lavoro qui è ridimensionato come volume, ma si puo' applicare lo stesso principio.

Chiedo scusa in anticipo se la mia esposizione dovesse sembrare poco chiara, ma non sono un gran oratore. A questo punto ditemi la vostra ;) --Torque (scrivimi!) 17:06, 8 feb 2019 (CET)[rispondi]

Assolutamente Favorevole--Ferdi2005 (Posta) 18:44, 8 feb 2019 (CET)[rispondi]
Anche io sssolutamente Favorevole, il bot non è nemmeno troppo difficile da scrivere, alla fine c'è una convenzione molto chiara e schemaica, la cosa più difficile penso sia inserire i dati su Wikidata, ma va considerato che fatto uan volta vale per tutte le wiki, è sempre un ottimo risparmio di tempo. --Emanuele676 (msg) 19:18, 8 feb 2019 (CET)[rispondi]
E poi qualcuno controllerà la correttezza degli inserimenti in wikidata?--Bramfab Discorriamo 19:28, 8 feb 2019 (CET)[rispondi]
Beh, dipendiamo da Wikidata per molte cose, quindi penso che non sia un problema enorme. Inoltre avere questi dati gioverebbe a tutte le wiki.--Ferdi2005 (Posta) 19:30, 8 feb 2019 (CET)[rispondi]
A tutte le wiki fino ad un certo punto, dato che ci interessano i titoli in italiano immagino.--Bramfab Discorriamo 19:39, 8 feb 2019 (CET)[rispondi]
Per la maggior parte dei film, quelli più noti, non c'è problema, quando si crea una voce su it.wiki si inserisce anche la traduzione del titolo su wikidata. Rimarebbe il problema dei film che non hanno una voce, ma alla fine, comunque si dovrebbe fare per tutte le voci degli attori che hanno partecipato a quel film. --Emanuele676 (msg) 20:09, 8 feb 2019 (CET)[rispondi]
Non ho capito quale sia il problema dei titoli, dato che si collega all'item non al titolo. E l'item ha titoli in tutte le lingue. Quindi la filmografia si collega a tutte le lingue.--Ferdi2005 (Posta) 01:01, 9 feb 2019 (CET)[rispondi]
@Bramfab, il modello delle filmografie del Progetto:Cinema richiede l'inserimento di: titolo italiano (se esistente), titolo in lingua originale, regista e anno di produzione. Quindi di interesse per altre edizioni linguistiche di wikipedia ci sono anche il titolo in lingua originale, lingua originale del film (o altrimenti non sapremmo quale mostrare), nome del regista e anno di produzione. Sono cautamente Favorevole alla proposta.--Moroboshi scrivimi 06:48, 9 feb 2019 (CET)[rispondi]
[@ Ferdi2005] Dall'item si può ricavare il titolo solo quando esiste l'interlink (ovvero se esiste la voce in locale), altrimenti possiamo ricavare solo l'etichetta (che è ambigua). --Horcrux (msg) 10:43, 9 feb 2019 (CET)[rispondi]
Perché l'etichetta sarebbe ambigua?--Ferdi2005 (Posta) 13:27, 9 feb 2019 (CET)[rispondi]

[ Rientro] Come [@ Torque] già sa, anche io sono Favorevole in generale alla proposta. Sul come gestire la cosa, possiamo discuterne. A naso, ci sono due metodi piuttosto semplici: usare {{Wikidata list}} per generare liste automatiche oppure fare un template apposito che pre-carichi una query su https://query.wikidata.org/.

Non nascondiamoci che servirà un certo lavoro di controllo incrociato fra noi e Wikidata per i primi tempi, quindi direi che possiamo tirare giù una serie di esempi (chessò, "attori famosissimi", "attori famosi solo in Italia", "attori famosi altrove", ecc.) e vedere come cercare di strutturare questo lavoro nei dettagli. Non ci sono dubbi, però, che sul lungo periodo la semi-automazione delle filmografie (ma anche delle discografie, ecc.) è l'unico metodo sostenibile per gestire questi dati (vedi anche questo post di Magnus Manske (uno dei più prolifici creatori di tool per Wikidata). --Sannita - L'admin (a piede) libero 10:47, 9 feb 2019 (CET)[rispondi]

ho paura che in questo modo si creerebbe una gran quantità di filmografie senza uno straccio di fonte. Da quando Wikipedia può prescindere dai "siti esterni"? --Lombres (msg) 12:02, 9 feb 2019 (CET)[rispondi]
Anche su Wikidata si possono mettere le fonti.--Ferdi2005 (Posta) 13:16, 9 feb 2019 (CET)[rispondi]
ma il bot potrebbe copiarle? E distinguere quando non ci sono? --Lombres (msg) 13:55, 9 feb 2019 (CET)[rispondi]
Favorevole, mi pare un'ottima proposta--Lemure Saltante Discutiamone 14:07, 9 feb 2019 (CET)[rispondi]
[@ Lombres] Quasi sicuramente sì, copiarle sì. Distinguerle quando non ci sono credo di no, ma si potrebbe trovare un modo di segnalarlo. (C'è la possibilità comunque e qui credo ci siano abbastanza persone esperte da porter mettere in piedi la soluzione :D)--Ferdi2005 (Posta) 14:17, 9 feb 2019 (CET)[rispondi]

────────────────────────────────────────────────────────────────────────────────────────────────────[@ Ferdi2005] Prendiamo il film Mario del 1984. Il suo item su Wikidata dovrebbe—in una Wikidata ideale—dirci che uno degli attori del film è Jean Beaudin; quindi nella filmografia di quest'ultimo vorremmo che apparisse automaticamente un wikilink alla pagina del film. Ma la pagina su it.wiki non esiste e il titolo "Mario", purtroppo, è ambiguo (il titolo corretto sarebbe Mario (film 1984)). Per ricavare questo titolo in automatico, si dovrebbe:

  1. Controllare se esiste su Wikipedia una pagina dal titolo "Mario":
    1. se non esiste, indicare quest'ultima nel link rosso;
    2. se esiste, controllare (come?) se esistono dei film omonimi:
      1. se non esistono, usare il titolo "Mario (film)";
      2. se esistono, ripetere lo stesso metodo inserendo l'anno nel disambiguante, e poi con eventuali altri tipi di disambiguante...

Tutto ciò senza considerare altre varie ed eventuali:

  • la voce del film è stata cancellata in quanto non enciclopedica (e quindi il link non andrebbe inserito affatto): come dichiararlo?
  • oltre a non esistere la pagina di Wikipedia in italiano, non c'è neppure l'etichetta in italiano su Wikidata: che fare?
  • eccetera

E, a meno che non mi sfugga qualcosa, tutto questo discorso riguarderebbe ogni singolo link rosso della filmografia di ogni attore, regista, ecc.
Imho siamo ben lontani dall'ottenere risultati soddisfacenti per casi come questo. Anche {{Wikidata list}} (che, come da manuale, usa l'etichetta per eventuali link rossi) dovrebbe ricadere nei problemi che ho descritto. --Horcrux (msg) 15:21, 9 feb 2019 (CET)[rispondi]

Mica il titolo visualizzato è Mario (film 1984). Il titolo visualizzato è sempre Mario, come si fa normalmente. Se non è presente la voce semplicemente si mette solo testo senza wikilink. Nel caso in cui manchi l'etichetta, è ovvio che chi, utente di WP in italiano, va ad inserire la filmografia inserisca anche l'etichetta, altrimenti si fa semplicemente vedere "etichetta mancante" e qualcuno andrà sicuramente a correggere, ma per la maggior parte delle voci non ci dovrebbero essere problemi.--Ferdi2005 (Posta) 15:36, 9 feb 2019 (CET)[rispondi]
In tal caso, se da un lato otterremmo l'automazione degli elenchi, dall'altro rimuoveremmo un incentivo a creare di nuove voci. Mettendo benefici e costi sui piatti della bilancia, io non sono così sicuro di vederla pendere a sinistra. --Horcrux (msg) 15:52, 9 feb 2019 (CET)[rispondi]
[@ Horcrux] Il problema dei link rossi si potrebbe forse mitigare in buona parte grazie al tuo punto 1.1 di qui sopra (mi sono permesso di numerare l'elenco): se non esistono pagine omonime su it.wiki, non vedo problemi a creare il link rosso; se esistono pagine omonime, semplicemente non si crea il link rosso. Ottimisticamente, spero che i casi di omonimia siano non più del 30% del totale. Ovviamente tutto ciò si può fare se il passaggio 1 (controllare se su it.wiki esistono pagine omonime) non è tecnicamente troppo dispendioso. --Epìdosis 19:16, 9 feb 2019 (CET)[rispondi]
Peraltro non credo che sia troppo complesso nel caso verificare se esiste già una voce col nome del film con disambigua, se esiste anche questa allora linkare a "titolo film (film anno)" altrimenti a "titolo film (film)". --Emanuele676 (msg) 19:22, 9 feb 2019 (CET)[rispondi]
Il mio era solo un esempio infatti. Ci sono tanti modi di fare le cose e credo che Wikidata sia il futuro.--Ferdi2005 (Posta) 19:34, 9 feb 2019 (CET)[rispondi]
scusate l’attesa, sono distante dal PC questo fine settimana! Quanto detto da Horcrux é uno dei miei primi pensieri riguardo a tutto questo! Preferirei infatti che le liste non vengano gestite da un template automatico ma creare un bot che controlli periodicamente formattazione, disambigue, errori, l’ordine, e che integri le voci mancanti leggendole da wikidata se presenti limitando al massimo le rimozioni di testo! In questo modo non si va a sostituire il lavoro degli utenti ma solo a correggerlo (basta fare un paragone con i bot che organizzano e aggiornano gli infobox). Uno dei problemi che più mi terrorizza é il dividere ad esempio i film in sottocategorie… uno script impreciso rischierebbe di danneggiare migliaia di voci già corrette!
Per quanto riguarda le fonti, nel caso di un wikilink attivo servono? --Torque (scrivimi!) 11:13, 10 feb 2019 (CET)[rispondi]
Scusate, ma iniziare a fare le prove in una sandbox, così iniziamo a vedere i problemi? --Sannita - L'admin (a piede) libero 14:17, 10 feb 2019 (CET)[rispondi]
Come Sannita, sono e sarò sempre favorevole a interventi verso l'automatizzazione di informazioni "schematiche" di questo tipo, compatibilmente con le soluzioni tecniche che le gestiscano. Facciamo delle prove e vediamo. --Superchilum(scrivimi) 23:33, 10 feb 2019 (CET)[rispondi]
Sono all'opera... sono sicuramente più lento dei botolatori già rodati, ma d'altronde da qualche parte devo pur iniziare! --Torque (scrivimi!) 10:27, 11 feb 2019 (CET)[rispondi]

Esempio di query che per Bruce Willis mostra alcuni dati utili che apparivano nella voce della filmografia

SELECT ?film ?filmLabel ?persLabel ?pers1Label ?countryLabel ?pubDate WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
  ?film p:P161 ?f.
  ?f ps:P161 wd:Q2680.
  OPTIONAL { ?f pq:P453 ?pers. }
  OPTIONAL { ?f pq:P4633 ?pers1. }
  OPTIONAL {
  ?film wdt:P495 ?country.
  }
  OPTIONAL {
  ?film p:P577 ?pd.
  ?pd ps:P577 ?pubDate.
  ?pd pq:P291 wd:Q38.
  }
}

Provala!

--Sabas88 (msg) 11:36, 11 feb 2019 (CET)[rispondi]

Solo un appello: che poi non passino i soliti fan di Wikidata a togliere filmografie già fatte meglio a mano per sostituirle a tutti i costi con filmografie fatte peggio con gli automatismi. Dovrebbe essere il contrario --Bultro (m) 18:12, 12 feb 2019 (CET)[rispondi]
Infatti andrebbe prima sistemato il caricamento dei dati su wikidata possibilmente da qualche fonte libera affidabile. --Supernino 📬 18:37, 12 feb 2019 (CET)[rispondi]
e più che altro che la fonte sia caricata su Wikidata e sia copiata su Wikipedia. Perché Wikidata rischia seriamente di riempire Wikipedia di infobox pieni di informazioni senza fonti, non iniziamo a farlo anche con altre sezioni delle voci (ma che la fonte sia anche "libera" e nello stesso tempo affidabile, sulle filmografie, la vedo dura) --Lombres (msg) 22:50, 12 feb 2019 (CET)[rispondi]
Il problema non è semplicemente aver indicata la fonte, ma avere un sistema di patrolling che segnali se viene cambiato un dato che fu inserito contestualmente ad una sua fonte. Questa è la debolezza di wikidata.--Bramfab Discorriamo 23:02, 12 feb 2019 (CET)[rispondi]

Aggiornamenti[modifica wikitesto]

Allora, non si è fatto più niente?--79.53.140.6 (msg) 20:08, 12 mar 2019 (CET)[rispondi]

Ci sto lavorando ma ho rallentato l'attività. Attualmente uno degli scogli, come emerge dalla discussione qui sopra, riguarda la logica secondo cui dovremmo operare. --Torque (scrivimi!) 10:39, 13 mar 2019 (CET)[rispondi]