Wikipedia:Bar/Discussioni/Invasione di grilli e cavallette su nl.wiki

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Invasione di grilli e cavallette su nl.wiki


Un bot sta inserendo migliaia di stub su grilli e cavallette su nl.wiki (per dare un'idea, a breve nl.wiki supererà de.wiki piazzandosi al secondo posto con più di un milione e mezzo di articoli). Esempio stub. Peccato che qui non si possa fare, altrimenti poi col giochino "voce a caso" non ci divertiremmo più. LOL. Comunque confido in Wikidata e nel fatto che in un prossimo futuro le voci su specie animali possano essere facilmente create estraendone i dati che sono praticamente gli stessi per ogni lingua.-- Romero (msg) 18:23, 22 apr 2013 (CEST)[rispondi]

Pazzesco, quel bot crea in media 1000 (mille) voci all'ora! --Horcrux92. (contattami) 18:38, 22 apr 2013 (CEST)[rispondi]
se le pagine sono enciclopediche, dove sta il problema? anzi, dovremmo averle anche qui --Salvo da PALERMO 19:03, 22 apr 2013 (CEST)[rispondi]
Appena aggiornata la voce Wikipedia in olandese. Confermo, a breve anche de.wiki sarà superata. --Epìdosis (msg) 19:19, 22 apr 2013 (CEST)[rispondi]
Da noi finirebbero tutte in cancellazione o direttamente in C4... --Yoggysot (msg) 21:46, 22 apr 2013 (CEST)[rispondi]
in realtà mi sembra che abbiano almeno un valido riferimento bibliografico (almeno nel caso linkato). --valepert 22:42, 22 apr 2013 (CEST)[rispondi]
In ogni caso sempre meglio di una strage di primogeniti. --f.87/dicheno/ 22:43, 22 apr 2013 (CEST)[rispondi]
In realtà da noi non andrebbero né in C1 né in C4, visto che le specie animali sono enciclopediche. Semmai si discuterebbe dell'utilità di avere migliaia di stubbini in più Jalo 22:58, 22 apr 2013 (CEST)[rispondi]
L'esempio linkato rientra perfettamente nella definizione di stub e non potrebbe mai essere cancellato in C4. E non supererebbe neanche una pdc per palese enciclopedicità dell'oggetto della voce. Che poi non piacciano le voci create da bot perchè sono non umane, fredde e senza sentimento, allora è tutto un altro discorso.-- Romero (msg) 23:02, 22 apr 2013 (CEST)[rispondi]

posto che sono voci enciclopediche e che potrei anche disinteressarmi della cosa, mi chiedo che senso abbia l'inserimento a tappeto di così tante voci... crearla è facile, gestire 500000 voci in più (il tasso di crescita degli ultimi mesi di nl:wiki) comporta un lavoro mica da ridere, a meno che nel frattempo non aumenti di pari passo il numero di utenti... bah... --torsolo 23:37, 22 apr 2013 (CEST)[rispondi]

Potremmo creare via bot le voci su tutti i numeri da 1 a 2 milioni e li supereremmo in un attimo. --Jaqen [...] 23:50, 22 apr 2013 (CEST)[rispondi]
Da membro del progetto Forme di Vita, dove sono stati fatti e sono in atto diversi esperimenti di creazione di voci in serie, posso dire che una voce creata da un bot ha sempre bisogno dell'intervento di un umano per elevarsi dal livello di miserrimo stub. Creare tanti microstubbini come quello linkato serve a poco, la voce oltre al nome riporta giusto una fonte e qualche dato tassonomico, la quantità di informazione contenuta è minima. Peraltro nell'esempio proposto mancano informazioni che un bot potrebbe facilmente inserire nella voce prendendole da una fonte online, ad esempio lo stato di conservazione ricavabile dal sito della IUCN (cosa che infatti viene sempre fatta nelle voci di FdV create dal bot su it.wiki). Per ogni voce è necessario qualche minuto per inserire varie informazioni, le foto, eccetera, in quanto tempo verrà fatto? Chi si metterà a destubbare tutti questi microabbozzi? Per quanti milioni di anni resteranno in questo stato? Quante maledizioni ci manderà chi deciderà di destubbarli (senza probabilmente riuscire a farlo su tutte le voci)?--l'etrusco (msg) 00:52, 23 apr 2013 (CEST)[rispondi]
La direzione che stanno prendendo le varie wikipedie, anche e sempre più in futuro grazie a Wikidata, è quella della creazione automatica dei contenuti. Con lo stesso sistema dei bot recentemente war.wiki e ceb.wiki hanno superato le 350 000 voci, a fronte di 80 utenti attivi su ciascun progetto; per fare un paragone la wikipedia in norvegese, che ha circa lo stesso numero di voci, vanta oltre 1800 utenti attivi e 63 sysop locali, mentre ceb.wiki ha 7 admin e war.wiki addirittura 2. Ora bisognerà porsi il problema di come 80 volontari, compresi 2 sysop, possano mantenere quasi 400 000 voci in ordine. Gli olandesi si accingono a superare de.wiki per numero di voci, ma hanno un quinto degli utenti attivi di quel progetto, e 60 sysop invece che 268. Il problema non è tanto l'utilità di queste voci, che secondo me c'è, ma è il mantenerle affidabili in un sistema aperto come quello di Wikipedia, libere da vandalismi, con informazioni verificabili e scritte in maniera decente. È una scommessa, come quella che sta all'origine di Wikipedia stessa, e gli olandesi hanno deciso di rischiare più degli altri. Io spero che vada tutto bene, ma bisogna anche prepararsi all'idea che in futuro wikipeida potrebbe essere meno aperta, oltre che più "automatica", con strumenti come quelli che già adottano ad esempio de.wiki e ru.wiki. Chissà, vedremo con Wikidata, probabilmente molti sforzi convergeranno su quel progetto dalle wikipedie locali, e probabilmente è un passaggio addirittura necessario se si vogliono vedere sviluppate le enciclopedie in tutte le centinaia di lingue minori che supportiamo, e in molte altre ancora. Personalmente sono contento che ci sia qualcuno che provi anche la strada dei bot a tutto spiano, ma sono anche sollevato che per ora non sia it.wiki. --Phyrexian ɸ 03:49, 23 apr 2013 (CEST)[rispondi]
Non ho ben chiaro se nei principi di Wikipedia sia più importante la quantità o la qualità. La lotta giornaliera ai vandalismi e alle cancellazioni fa più pensare alla seconda, pertanto invece di stare a fissare il contatore dei nostri vicini di casa diamoci da fare a migliorare le nostre pagine dove veramente se ci fosse un campionato di stupidaggini saremmo primi con onore. Non mi sembra che lo Stub da voi indicato sia enciclopedico. Per lo più ha carattere da vocabolario, buono al massimo per Ruzzle.--A proietti (msg) 07:20, 23 apr 2013 (CEST)[rispondi]
Nel caso di queste micro voci, più che un inserimento via bot farebbe comodo un sistema semi-automatico. L'utente sceglie una voce da scrivere, gli viene creato il micro stub che vuole, e poi lui lo migliora. Non si avrebbero 50.000 micro stub, e il singolo utente non dovrebbe perdere tempo ad inserire le informazioni base di ogni voce Jalo 08:30, 23 apr 2013 (CEST)[rispondi]
Insomma, avere il db per l'inserimento via bot, solo che invece di farlo in automatico lo faremmo on demand :) Jalo 08:31, 23 apr 2013 (CEST)[rispondi]
Concordo con Etrusko e A proietti. Quando la quantità è a discapito della qualità, io scelgo la qualità. --Eumolpa (msg) 10:19, 23 apr 2013 (CEST)[rispondi]
Beh, questa questione è interessante: l'essere liberamente modificabile da chiunque ostacola la crescita di wikipedia. In pratica il fatto che l'enciclopedia sia liberamente editabile anche da IP genera il problema che il numero di utenti è un parametro importante nella gestione di un insieme di voci, perchè troppi pochi utenti significa che le voci verrebbero lasciate a se stesse (partendo dal mio personale presupposto che nell'inserimento massivo via bot la qualità non venga compromessa se le informazioni inserite sono corrette).
Ma se il problema di creare via bot tantissime voci è quello che poi non si possono controllare, basta dire al bot di proteggerle tutte dalle modifiche! Non dico di farlo per davvero, ma di fatto si deve scegliere tra: A) Migliaia di voci enciclopediche, ma non editabili da chiunque. B) Nulla. Io ci penserei. --^musaz 12:13, 23 apr 2013 (CEST)[rispondi]

(Rientro) Mah... cioè posso capire creare qualche migliaio di voci in un mese ma così è troppo, più che altro per controllare errori e vari altri problemi. --Erik91☆☆☆ 12:41, 23 apr 2013 (CEST)[rispondi]

Ho l'impressione che per crescita di Wikipedia intendiate l'incremento di pagine e non quello del sapere è palese. Pur di vedere it.wiki tra le prime in testa alla classifica limitereste anche la caratteristica fondamentale su cui poggia tutto ovvero il libero contributo. Lasciate perdere le forme viventi per favore, se volete ingrossare il server fate un bot che generi voci sulle stelle magari (anche se così mi metto contro gli Astronomi!:D).--A proietti (msg) 12:53, 23 apr 2013 (CEST)[rispondi]
Imo non si tratta di ingrossare il server ma di voci su cose esistenti, che magari singolarmente riceveranno una visita al mese ma la cui utilità sta nel loro numero: se io trovo un insetto per terra, e voglio sapere che diavolo è, so che wikipedia ha un database con 351354 stupidi insetti e che quindi c'è una certa probabilità di trovare anche il mio. Lo stesso vale per le stelle, i camaleonti (e i meteoriti, che sono stati già inseriti massicciamente via bot... e ci si lamenta di grilli e cavallette!). --^musaz 13:26, 23 apr 2013 (CEST)[rispondi]
Infatti. Una pagina come quella di nl.wiki non servirebbe assolutamente a nulla se volessi riconoscere un insetto perché non mi da nessuna informazione tanto meno sul suo aspetto e sull'areale (almeno a sapere se vive in Italia...). Ecco perché sono convinto che non ha nessun senso crearle. Credo che se la classifica fosse fatta invece che sulle voci sul rapporto voce/parole contenute allora sarebbe un altro discorso ;).--A proietti (msg) 13:37, 23 apr 2013 (CEST)[rispondi]
(fc) Beh io saltavo il passaggio "trovo l'insetto, vado dal mio amico insettologo il quale va a cercare", ma era solo un esempio. Il discorso era generale, a prescindere dal come uno trova la voce (tipo cercando un termine che ha trovato da qualche parte). --^musaz 15:14, 23 apr 2013 (CEST)[rispondi]
Ottima l'idea di Jalo sulla funzione di scrittura semiautomatica on demand. Alcuni progetti già la adottano, in qualche maniera. IMHO è la strada da battere. --pequod ..Ħƕ 14:53, 23 apr 2013 (CEST)[rispondi]
D'accordissimo con Pequod, e' possibile implementare l'idea di Jalo, almeno sperimentalmente per un mese, tanto per vedere come va?--Bramfab Discorriamo 16:02, 23 apr 2013 (CEST)[rispondi]
Non è così semplice. Immagino che la cosa più semplice sia un tool sul toolserver (e un db con i dati a disposizione). Cioè, non sembra una cosa da poco :/ Jalo 16:29, 23 apr 2013 (CEST)[rispondi]
L'idea di Jalo è ottimale per ottenere uno standard strutturale delle varie voci. Per creare le pagine io applico lo stesso modo con un'applicazione esterna che mi genere la pagina per poi trascriverla in Wikipedia. Ritengo però un pò macchinoso il meccanismo di dover chiedere per ottenere e chissà dopo quando ottenere...Ci potrebbero essere ritardi, ingorghi e dimenticanze oltre ad un lavoro in più per gli operatori.--A proietti (msg) 17:50, 23 apr 2013 (CEST)[rispondi]

(a capo) Contrario ad inserimenti massivi di voci di forme di vita, il 99% delle quali non avrebbe neanche un'immagine, un template ed una tabella. Si è tentato qualcosa del genere l'anno scorso per le Cycadales, e parliamo di sole 326 specie, ma ad un anno di distanza e nonostante un festival della qualità apposito, vi sono ancora voci come questa che hanno in sé poche info.--Eumolpo (πῶς λέγεις; = che vuoi dire?) 18:13, 23 apr 2013 (CEST)[rispondi]

Io trovo che sia comunque più utile una micro voce come quella linkata da Eumolpo rispetto a non aver la voce, ribadisco che ci si concentra sul problema sbagliato. Il problema per me non è tanto creare le voci, ma mantenerle. Siamo in grado di mantenere il nostro milione (che già è composto in buona parte da STUB)? E saremmo in grado di mentenere un improvviso e significativo aumento del numero di voci? Questo è il problema principale che secondo me dovremo affrontare in futuro, come mantenere "libera" Wikipedia ma allo stesso tempo attendibile e autorevole. --Phyrexian ɸ 18:25, 23 apr 2013 (CEST)[rispondi]
E qui veniamo al punto dolente della questione, Phyrexian, non so qual è il tuo rapporto con gli OS e quello degli altri. Ho sotto controllo, e con gran fatica, circa 16.000 voci, gran parte di forme di vita, ma ti assicuro che, conti alla mano, su 1.026.000 voci che conta adesso itwiki, almeno l'8% non è OSservato da nessuno (oltre 80.000 voci). Figuriamoci se inondiamo itwiki di centinaia di migliaia di forme di vita....inviteremmo a nozze i vandali!!!--Eumolpo (πῶς λέγεις; = che vuoi dire?) 18:43, 23 apr 2013 (CEST)[rispondi]
Esatto, è proprio questo il problema, penso dovremmo quindi interrogarci sulle possibili soluzioni. Non possiamo certamente limitare la crescita dell'enciclopedia per paura dei vandali, ma per contro non possiamo certamente abbandonare interi segmenti del Ns0 al suo destino. Anche perché i vandali sono solo uno dei problemi, una voce che non sia seguita o vagliata da un wikipediano esperto facilmente divente non attendibile, le informazioni non verificabili ed esposte in un collage di concetti che si discostano considerevolmente dalla forma ideale della lingua italiana (come ben sai), e in poche parole diventa non più fruibile. Certo le contromisure andranno prese qualora se ne vedrà il bisogno, ma iniziamo a pensarci su. Anche perché il concetto olandese di "crescere molto in fretta" non sarebbe neanche male, però non lo si può fare a scapito della qualità. --Phyrexian ɸ 18:52, 23 apr 2013 (CEST)[rispondi]

Fare come tr.wikipedia.org, modifiche ammesse ma verificate prima della pubblicazione.Perché vandalismi e cavolate sono in grande quantità. --Spazzino (msg) 22:02, 23 apr 2013 (CEST)[rispondi]

Una domanda-considerazione: riferendomi come esempio a quello citato da Romero (nl:Metioche perpusillum) noto che:

  1. è uno stub orfano su un nome-specie sconosciuto: infatti è definita da un autore nel 1912 e poi riclassificata probabilmente perché è stato revisionato il genere originario con conseguente spostamento in massa delle specie comprese senza entrare nel merito della specie. Ammesso che la specie esiste (perché l'esistenza di un nome incluso in letteratura nel 1912 non implica necessariamente l'esistenza fisica della specie). Su Google ci sono appena 208 ricorrenze del nome di questa specie, per lo più ricorrenze che rimandano a banche dati tassonomiche ridondanti,
  2. dall'enciclopedia è impossibile che qualcuno raggiunga quella voce a meno che non conosca l'esistenza di quel nome-specie e si tolga la curiosità mettendolo direttamente nell'URL della barra degli indirizzi o, nella migliore della ipotesi, cercandolo con il motore di ricerca (esterno o interno). Chi farebbe una cosa del genere? non certo un profano, solo uno specialista. E si ritroverebbe in una pagina che non riporta alcuna informazione in aggiunta a quelle che ha già. Ipotesi comunque alquanto improbabile dato che uno specialista non andrebbe a cercare un approfondimento di nicchia proprio in un'enciclopedia generalista.
  3. anche nell'ipotesi remotissima di un profano che arrivi a quella voce per chissà quale coincidenza astrale, aprirebbe la pagina e trarrebbe come conclusione il classico "esticazzi"
  4. aggiungiamo la considerazione espressa già da altri sulla vulnerabilità ai vandalismi di questi stub di nicchia sconosciuti a chiunque, probabilmente non inclusi negli OS di nessuno. Ovviamente il danno di un tale vandalismo sarà pari a zero dal momento che quella voce non sarà fruita mai da nessuno
  5. infine mi domando quale utilità può dare un contenuto del genere, difficilmente raggiungibile, quando sono disponibili banche dati più adatte alla raccolta di questo genere di contenuti in quanto archiviati secondo chiavi gerarchiche che permettono di estrapolare dati aggregati (contrariamente ad un sistema di archiviazione tipo Wikipedia). In altri termini, Wikipedia non è adatta ad essere una mera raccolta di dati "scorporati" privi di valore aggiunto. E non diciamo che lo stub sarà prima o poi ampliato, perché a quel nome-specie non potrà mai essere aggiunta alcuna informazione.

Detto questo, mi chiedo: a che pro? Cordiali saluti --2.39.231.151 (msg) 23:47, 23 apr 2013 (CEST)[rispondi]

Naturalmente l'istanza di Phyrexian va tenuta in conto e valutata: così, in generale, meglio avere uno stubbino che niente. Istanza che, in generale, è comprensibile. Ma noi dobbiamo stare attenti a non lasciarci prendere la mano da questo ragionamento. L'elemento della manutenzione è fondamentale: una voce creata in serie non ha l'affetto e la cura di nessuno. Nessuno reputa che sia importante: è solo che un po' più semplice da mettere al mondo. Allora, quando ci diciamo "meglio un'informazione che niente", poniamoci questo problema innanzitutto per voci che in questa lista sono in grassetto. Perché lì certamente mancano ettolitri di informazioni. Quando avremo portato tutte quelle voci a livello di eccellenza, avremo fatto qualcosa di fronte alla quale essere o meno arrivati a un milione e mezzo di voci è una questione del tutto priva di importanza. Le voci che tutte le wikipedie dovrebbero avere sono circa un migliaio ed esiste una lista espansa di quasi 4000. Questo è indubbiamente il nocciolo del progetto. Senza dubbio uno può essere più interessato alle restanti 1.022.000, ma se si vuole "stressare" il progetto verso una certa direzione, lo si deve fare in direzione di quelle 4000, non di mille nuovi stubbini l'ora su grilli e cavallette. La creazione on demand delle voci è tutto un altro discorso. --pequod ..Ħƕ 00:24, 24 apr 2013 (CEST)[rispondi]
L'intervento dell'IP è assolutamente di buon senso, però vale per le specie animali (tral'altro, non dovrebbe occuparsene Wikispecies?): se invece di insetti fossero stati, per esempio, i comuni di un Paese, non sarei daccordo perchè le voci sui comuni non sono inutili.E comunque, ora è troppo "presto" ma quando fra qualche tempo la qualità dei contenuti sarà tale che i contributi da IP saranno in prevalenza da revertare, o comunque controllare, l'idea di impedirene la modifica a insiemi di pagine sarà proposta sempre più spesso. Quando succederà, per le voci create da bot resterà solo il problema (non proprio oggettivo) della loro utilità. --^musaz 00:33, 24 apr 2013 (CEST)[rispondi]
Io penso che quelle voci, anche se sono create da un bot, meriterebbero di stare su Wikipedia.
Abbiamo tantissime voci su meteoriti e minerali create da bot, quindi per analogia penso che anche le voci sugli insetti create da bot possano andare bene. Il problema della manutenzione delle voci è onnipresente: in questi mesi non ho avuto tempo di controllare gli osservati speciali e le poche volte che lo faccio trovo sempre qualche vandalismo o frase non corretta, in genere ad opera di utenti non registrati, quindi io sarei dell'idea di aprire le porte ai bot e chiudere le porte agli utenti non registrati: in questa maniera penso che avremmo un vantaggio sia in termini qualitativi che quantitativi e la revisione delle voci diventerebbe più semplice. --Daniele Pugliesi (msg) 03:27, 24 apr 2013 (CEST)[rispondi]
Da quale fonte il "bot" prenderebbe l'oggetto della voce? è in grado di discernere tra un errore di trascrizione, un nomen nudum, una sinonimia, un'omonimia, un nome invalido? Non stiamo parlando di specie di mammiferi che, si e no, si aggirano sulle cinque migliaia: esistono diversi milioni di nomi di di insetti, creati dal settecento ad oggi, a fronte di un numero *stimato* dell'ordine di un milione di specie realmente esistenti e molte ancora sconosciute (cioè prive di nome). Solo negli ultimi decenni si sta lentamente facendo piazza pulita di tutti i nomi-specie-bufale, ma molti di questi nomi-specie sono riportati ancora in letteratura e citati in questa o in quella checklist "as is without any warrancy". Non ci sono due liste "uguali", a parte quelle ridondanti che estrapolano i dati da altre liste, esistono anche liste farlocche tipo zipcodezoo che incorpora qualsiasi dato estrapolato a prescindere dalla sua provenienza (scherzi delle automazioni). Il "bot" è in grado di analizzare, confrontare, verificare, dedurre? L'intelligenza artificiale a buon mercato è arrivata a simile operatività? Meteoriti minerali e comuni sono dati inconfutabili, i nomi di insetti (evitiamo di associare il nome ad una specie) no. Insiemi di Voci scritte in questo modo sono perciò privi di qualsiasi consistenza se dietro non c'è un accurato lavoro di ricerca che può richiedere giorni e giorni, se non mesi. Ho impiegato 10 mesi di ricerca in letteratura per venire a capo sull'elenco di specie di una famiglia di insetti che ammonta a qualche migliaio e mi sono fermato a circa metà del lavoro. Scusa, Daniele, ma lasciatelo dire: la tua idea (penso che anche le voci sugli insetti create da bot possano andare bene) si basa su un'assoluta mancanza di cognizione del problema, che non è riconducibile ai minimi termini facendone una questione di ip o registrati. L'unica motivazione solida e che nessuno, per falso pudore, vuole ammettere, è che l'utilità di questo sistema è quello di far crescere il numero di lemmi per scavalcare questo o quel progetto e darsi medagliette internazionali che attestano "quanto siamo bravi e belli". Continuo a chiedermi: a che pro? Buona giornata --2.39.231.151 (msg) 06:38, 24 apr 2013 (CEST)[rispondi]
mi chiedo ma perche' questi bot le voci non le caricano direttamente su wikidata, in modo che possano essere create sulle varie versioni linguistiche? la qualita' e la quantita' non confliggono, i problemi di voci scadenti, incomplete, brutte permangono a prescindere o meno dalla presenza di cavallette, asteroidi, comuni francesi, calciatori italiani, ecc. ecc. --Rago (msg) 08:56, 24 apr 2013 (CEST)[rispondi]
Sei il mio idolo Jalo 09:41, 24 apr 2013 (CEST)[rispondi]
Ma se il problema è a monte, come ha ben spiegato l'IP, nella ricerca e verifica delle fonti, che può fare solo un "umano" procedendo manualmente per ciascun singolo soggetto, si può rischiare di caricare su wikidata una massa incontrollata di dati, diffondendoli da lì su altre wiki? --Eumolpa (msg) 09:59, 24 apr 2013 (CEST)[rispondi]
P.S. l'equivalenza "non registrato = cattivo utente/vandalo" - "registrato = buon utente", lo dico come patroller, mi pare un po' semplicistica e arbitraria. Chiudere le porte alla libera modifica ai non registrati sarebbe contro il terzo pilastro e snaturerebbe l'essenza stessa del Progetto. --Eumolpa (msg) 10:09, 24 apr 2013 (CEST)[rispondi]
Quando un bot crea tonnellate di voci (o quando lo farà su wikidata) utilizza sicuramente un database che è stato considerato affidabile. Non è che riempiamo wiki di schifezze :) Poi sulla quantità un errore può esserci, siamo wiki, ma non è immondizia Jalo 11:43, 24 apr 2013 (CEST)[rispondi]

[ Rientro] Non ho molto tempo, dunque mi concentro solo sull'intervento di Rago e su quello di Eumolpa. Sì, Wikidata dovrebbe essere già il primo progetto da prendere in considerazione per queste operazioni, ma c'è qualche piccolo problema (facilmente risolvibile, come vedremo):

  1. innanzitutto, serve prima raggiungere un minimo di consenso su eventuali proprietà aggiuntive (ossia sui campi degli infobox ancora mancanti, detta in termini brutali), ma buona parte delle proprietà per animali e piante già sono state create e se c'è da crearne altre perché necessario, il consenso si fa in due minuti;
  2. successivamente, serve inserire una eccezione nelle regole di "enciclopedicità", ma anche qui se necessario, l'eccezione viene approvata entro pochissimo.
  3. l'unico vero problema sono quelle proprietà la cui tipologia ancora non è stata approvata (tempo, coordinate geografiche, stringhe numeriche con o senza unità di misura...) e qui solo il tempo può aiutare, perché gli sviluppatori devono necessariamente metterci il loro tempo per crearle.

Per quanto riguarda, il controllo dei dati cui fa riferimento di Eumolpa è fondamentale, ma può essere chiaramente qualcosa che deve essere fatto solo da esseri umani e prima di caricare i relativi dati su Wikidata. Questa operazione di nl.wiki è l'ennesima riprova che bisogna sempre anteporre la qualità alla quantità. --Sannita - L'admin (a piede) libero 12:03, 24 apr 2013 (CEST)[rispondi]

quando fra qualche tempo la qualità dei contenuti sarà tale che i contributi da IP saranno in prevalenza da revertare, o comunque controllare, l'idea di impedirene la modifica a insiemi di pagine sarà proposta sempre più spesso. Quando succederà... Quando succederà, nel mondo saranno successe tante di quelle cose, saranno stati scritti tanti di quei romanzi e saggi, saranno state tante e tali le nuove scoperte pronte a rinnovare e rivoluzionare il sapere consolidato che avremo di nuovo bisogno di lasciare campo agli utenti non registrati. La storia vera sugli IP la racconta Aaron Swartz qui: When you put it all together, the story become clear: an outsider makes one edit to add a chunk of information, then insiders make several edits tweaking and reformatting it. Quindi, di fatto, gli IP sono statisticamente il nocciolo di questo progetto e senza di essi noi insider non avremmo un bel nulla da formattare, tranne i pochi contenuti che inseriamo noi stessi. E su it.wiki gli utenti assidui sono circa 500, di cui forse poco più della metà è in grado di formattare una voce come Jimbo comanda. Il giorno che si alzeranno barriere ufficiali verso gli IP credo proprio che smonterò baracca e me ne andrò. E me ne andrò al doppio della velocità se la ragione di questa alzata di scudi saranno i contenuti creati via bot. Viva la contribuzione anonima! :-) --pequod ..Ħƕ 14:15, 24 apr 2013 (CEST)[rispondi]
pequod ti voglio bene :-) --torsolo 15:48, 24 apr 2013 (CEST)[rispondi]
Anch'io te ne voglio e ovviamente anche all'ottimissimo ^musaz. :-) --pequod ..Ħƕ 15:54, 24 apr 2013 (CEST)[rispondi]
Si ecco non volevo mettere in discussione i principi di wikipedia :-) Il mio discorso era più che altro un discorso pratico: dopo che una voce va in vetrina la maggior parte delle volte la cronologia è piena di rollback ed in generale se si vuole mantenere la stellina bisogna che un certo numero di persone abbia la voce nei propri osservati speciali. Ora, mettiamo che in un certo futuro le voci in vetrina saranno cento volte di più rispetto a quelle di ora: affinchè rimangano allo stesso standard qualitativo è necessario che utenti in numero cento volte maggiore abbiano la voce negli OS. Il problema è che la popolazione terrestre è una quantità finita. --^musaz 16:03, 24 apr 2013 (CEST)[rispondi]

(Rientro) Favorevole alle voci semiautomatiche, in modo tale da facilitare utenti ed IP nella creazione di una voce, Contrario alla verifica a priori dei contributi e (molto contrario) al blocco a priori degli IP dalla contribuzione. --Gce (msg) 17:46, 24 apr 2013 (CEST)[rispondi]

Contrario Continuo a ritenere un profondo errore affidare ad un bot la creazione massiva di voci: gli olandesi, tanto acclamati, hanno decine di migliaia di voci come questa da due e più anni, dove le due righe di testo dicono per esteso solo quello che è già nel template. In queste voci passano solo i bot a fare modifiche per lo più estetiche, rimarranno in questa condizione per altri anni. Quella vietnamita è nelle stesse condizioni. Già il confronto con la nostra voce può far capire quanto è utile l'intervento di un essere umano nell'aggiungere info alla voce. Ogni tanto questa smania di aggiungere voci a quintalate per raggiungere le altre wiki fa capolino fra le forme di vita ma, imho, se deve riempire itwiki di scheletri che per decenni rimangono in questo stato, è meglio lasciar perdere.--Eumolpo (πῶς λέγεις; = che vuoi dire?) 05:53, 25 apr 2013 (CEST)[rispondi]
Sono completamente d'accordo con Eumolpo e quoto ogni sua parola. Insomma sono Contrario alla creazione seriale di microstub senza realistica speranza di ampliamento in un tempo finito. Sono favorevole alla creazione di voci via bot solo ed esclusivamente se viene fatta in numero gestibile dal progetto di riferimento nell'ambito di un festival della qualità o simile iniziativa che implichi obbligatoriamente la revisione/ampliamento da parte di un utente umano.--l'etrusco (msg) 11:18, 25 apr 2013 (CEST)[rispondi]

Il discorso in generale[modifica wikitesto]

Mi pare che si stia facendo un po' di confusione, stiamo discutendo contemporaneamente di quel che fa nl.wiki in questi giorni, di quello che noi potremmo fare nei prossimi giorni e in che modo farlo, di quello che si potrebbe fare su Wikidata e infine dei massimi sistemi del Progetto. Ora assumendomi la colpa di quest'ultima deriva della discussione, vorrei continuare in questa sezione il ragionamento sui massimi sistemi, perché lo trovo non solo interessante ma utile. Quindi prescindendo dai casi particolari come nl.wiki o la nostra, ma citandoli solo come esempio. Vado a capo e ricomincio.

Secondo me è assolutamente essenziale che non si vengano a creare contrasti fra i 5 pilastri, e nel caso in esame fra il 1° e il 3°, anche se io chiamerei in causa anche il 2°. Ora il ragionamento che faccio è questo: secondo il primo pilastro noi dovremmo avere le voci su tutti gli animali che siano mai esistiti (sì anche quelli schifosi e insettiformi), e se abbiamo uno strumento automatico che ne crea qualche milione è irragionevole non disporne. Ed ecco le ragionevoli obiezioni. La prima forse è una mancanza di coraggio o di ambizione (lo stesso coraggio e la stessa abizione che stanno alla base di tutta Wikipedia, lo ribadisco), e chiama in causa il terzo pilastro, stante il quale le nuove milioni di voci create in automatico sarebbero immediatamente e liberamente modificabili da chiunque. Ora, al posto dell'ultima frase, è molto facile leggere "malignamente" modificabili da "i vandali", anche se questa lettura va contro la presunzione di buona fede, che ricordo essere una linea guida importante del progetto. Va anche ricordato però che pure l'utilizzo del buon senso è una linea guida importante, e il buon senso ci dice che in quel modo milioni di pagine sono a rischio vandalismo incontrollato, ("vandalismo" per semplificare, come sappiamo ci sono molti altri problemi in una voce abbandonata), e qui entriamo in conflitto col secondo pilastro, che impone alle voci di essere neutrali, verificabili, e in poche parole autorevoli; e questo ad ogni costo, si badi bene, anche rinunciando temporaneamente al terzo pilastro.

Ora, se il secondo e il terzo pilastro entrano in conflitto, ed entrambi già sono i coflitto col primo pilastro, siamo arrivati a uno stallo alla messicana in cui sembra rimanere da scegliere solo di che morte deve morire Wikipedia. Ma qui, sul più bello e all'apice del climax, colpo di scena: entra in gioco l'intelligenza umana che salva la baracca e i burattini. Ripensando al ragionamento appena concluso, notiamo che non si tratta di idee od opinioni originali, non è un ragionamento creativo, ma deduttivo, anche se è stato un essere umano a compierlo (vi assicuro di non essere un bot ^^) tutti i suoi passaggi sono stati dedotti dalle regole che abbiamo dato al Progetto, si tratta quindi di un ragionamento automatico, non "intelligente", ed ha infatti portato allo stallo. Questo perché IMVHO nessun sistema di regole pensate per interagire con gli esseri umani può funzionare, visto che noi siamo una variabile assolutamente caotica e indefinibile. E conseguentemente nessun sistema automatico (leggi bot) può funzionare indefinitamente, stante la variabile umana (perché i sistemi automatici obbediscono a delle date regole). Ora non voglio andare ulteriormente off topic ma vorrei sottolineare che in questo sta la genialità del quindi pilastro. Tornando al tema, questo è un dilemma che solo noi possiamo risolvere, e dobbiamo solo scegliere il come. Il modo più immediato che salta agli occhi sarebbe eliminare questa variabile caotica che incasina tutto, e lasciare in futuro che solo i bot possano editare i progetti (magari attraverso Wikidata). Questo ovviamente sarebbe inaccettabile ma di più, probabilmente impossibile, perché noi non stiamo scrivendo un'enciclopedia per imposizione divina (appunto non siamo bot) ma lo facciamo perché delle persone la leggano. Questo per quanto scontato è fondamentale, quindi le persono non possono essere escluse dall'equazione-Wikipedia. E allora che fare? Limitare la contribuzione degli IP? Questo sarebbe accettabile per qualcuno, ma molti lo rifiuterebbero (ad esempio tutti gli IP credo), e produrrebbe un danno in termini di contribuzione mancata veramente spaventoso, perché come ricordavano i patroller più sopra, non tutti gli IP sono vandali, non tutti i registrati sono wikipediani eccellenti, ma soprattutto buona parte delle modifiche, dal patrolling alla wikificazione ma soprattutto all'inserimento e alla verifica delle informazioni, sono fatte dagli IP, che davvero sono il cuore di questo progetto. Allora per contro limitiamo l'inserimento di nuove voci a quelle che l'attuale comunità può effettivamente gestire. Anche questo, se per qualcuno potrebbe essere accettabile, io lo troverei aberrante. Uno dei modi per uccidere Wikipedia è proprio limitarne la crescita. Secondo me dobbiamo sforzarci di trovare nuovi metodi per rendere gestibile all'insegna del secondo pilastro un numero di voci che è di molto superiore a quello di un milione. E non pensiamo solo a it.wiki, perché la wikipedia in friulano, ad esempio, dovrebbe avere anch'essa tutte le voci sugli insetti e gli altri animali, ma la comunità di quel wiki, se riuscirà a sopravvivere, prevedibilmente non crescerà di molto.

Piccola parentesi, poi la smetto. Più su parlavo di ragionevoli obiezioni all'uso di un bot che crei milioni di voci in automatico, mentre poi ne ho descritta solo una (l'ingestibilità delle voci). Segnalo che non ritengo assolutamente valida né di buon senso l'opinione che ritiene le voci sugli insetti inutili, non interessanti, non lette ecc... Secondo me queste sono questioni che non andrebbero nemmeno prese in considerazione, alla luce di quanto ho scritto sopra, ovvero che noi scriviamo per essere letti dagli altri esseri umani. E nessuno, nessuno può dire cosa sarebbe capace di fare un essere umano con le informazioni prese da uno STUB su una cavalletta, o da un milione di essi. Non esistono voci inutili. Un'altra obiezione invece certamente di buon senso è: ma il bot è affidabile? Beh, ovviamente deve esserlo, e deve esserlo la lista da cui prende i dati, e se quest'ultima non lo è (come parrebbe nel caso della nomenclatura degli insetti) allora non c'è nemmeno da discutere, le informazioni andrebbero sempre controllate prima di essere pubblicate.

In sostanza il mio discorso è più sul futuro del progetto che sui grilli di questi giorni. Ci sono problemi che prima o poi dovremo affrontare, ed è bene esserne coscienti e prepararsi. Uno di questi è l'immenso numero di voci che ancora mancano all'enciclopedia, un altro è come rendere stabili le pagine ormai complete. Io lancio un sassolino: le pagine di discussione sono veramente una cosa utile. Non ho fatto proposte e non mi attendo risposte, ma certamente sono ben accetti pareri sul mio ragionamento, se qualcuno ha avuto la pazienza di seguirlo fino in fondo. :-) --Phyrexian ɸ 19:16, 25 apr 2013 (CEST)[rispondi]

Prima divagazione OT dell'IP
Scusa Phyrexian, non so se hai letto le precedenti considerazioni dell'IP ([1], [2]) ma visto che ne fai una questione di conflitto tra principi (o "pilastri") ti faccio una domanda schietta: è ammissibile che uno strumento che dispensa sapere (=enciclopedia) contenga informazioni false e quindi dispensi il non sapere?. Se la risposta è "SI" allora l'argomento è chiuso: i contenuti si possono moltiplicare in modo randomizzato e i vandalismi non rappresentano un problema. Se invece la risposta è "NO" allora converrai che nessun principio (=pilastro) ha priorità sulla genuinità del contenuto (ovvero nessun pilastro può giustificare l'inserimento di un contenuto falso). Fatta questa premessa vengo al dunque ipotizzando che tu sia d'accordo con il "NO".
Asserisci che le voci sugli insetti sono utili a prescindere e questo non sono certo io a discuterlo visto che mi occupo di insetti. Ma è ammissibile che un utente, umano o robot, crei una voce su un insetto che non esiste? Immagino che anche in questo caso la risposta spontanea sia "NO". Ebbene, passiamo al caso pratico: il bot crea un lemma sull'insetto Beckeriella niger (Williston, 1897) dicendo che bla bla bla e poi crea un altro lemma sull'insetto Gastrops niger Williston, 1897 dicendo che bla bla bla. L'enciclopedia conterrà due lemmi, sarà più ricca, il lettore saprà che esistono due insetti, ma nessuno gli fa sapere che in realtà uno dei due insetti non esiste. E qui arriviamo al paradosso: l'enciclopedia dispensa il "falso" ovvero il "non sapere". Penserai che questa eventualità sia impossibile, perché se le fonti sono attendibili il bot non potrà acquisire informazioni false ed è qui che ti dico che ti sbagli: in Beckeriella#La specie niger è spiegato che per qualche arcano motivo la proliferazione delle citazioni nelle pubblicazioni scientifiche ha prodotto la creazione di un insetto inesistente. Per acquisire le informazioni contenute in quel paragrafo l'utente Furriadroxiu ha impiegato una settimana di ricerche e di verifiche incrociate nell'arcipelago della letteratura scientifica per giungere alla conclusione che nessuno, oggi come oggi, è in grado di scoprire chi ha preso una cantonata inventando un insetto che non esiste, ma dal momento che la cantonata è entrata nella letteratura scientifica dalla porta di servizio, sarebbe bene che un'enciclopedia che trasmette sapere lo faccia contestualizzando adeguatamente le informazioni sia pur senza entrare nel merito. Può un bot che crea contenuti alla velocità di 1000 lemmi all'ora fare questo? Lascio a te la risposta. Buon 25 aprile --2.39.237.219 (msg) 20:38, 25 apr 2013 (CEST)[rispondi]
Ti rispondo altrettanto schiettamente: scusa ma tutto questo che c'azzecca con quello che ho scritto? Ho anche fatto una breve introduzione per dire che il discorso prescindeva da casi specifici, l'ho messo in un nuovo paragrafo intitolato "Il discorso in generale"... Forse sono io che non ho afferrato, ma la tua domanda davvero non c'entra nulla. Mi pare siamo tutti d'accordo sul fatto che per voci da scrivere si stia parlando di voci enciclopediche, e che queste debbano contenere dati verificabili e non di fantasia. Poi io per "pilastri" non intendo in generale "principii", intendo proprio i 5 pilastri numerati che stanno alla base di Wikipedia, ho messo anche il link. Io di insetti non mi occupo, ma capisco bene che quel che dici possa accadere, e infatti ho scritto che le liste dalle quali un eventuale bot dovesse prendere i dati dovrebbero essere controllate e considerate attendibili prima della pubblicazione. Scusa ma davvero non capisco cosa vuoi dire, quale conclusione dovrei trarre dal tuo intervento? Che i bot sono stupidi lo sapevamo già, così come lo sono i server e le automobili. --Phyrexian ɸ 21:34, 25 apr 2013 (CEST)[rispondi]
Seconda divagazione OT dell'IP
La risposta mi conferma che non sei a conoscenza delle problematiche e che non hai afferrato. Concentriamoci sul fulcro: tu pensi che la creazione da bot sia una risorsa dando per scontato che l'intero processo si svolga secondo i canoni, Io penso che tu ti sbagli perché quello che dai per scontato non lo è. Ti ho solo citato uno dei tanti esempi che dimostrano che non c'è nulla di scontato.
il discorso prescindeva da casi specifici. Veramente hai scritto "non ritengo assolutamente valida né di buon senso l'opinione che ritiene le voci sugli insetti inutili" e qui si sta discutendo di un bot che sta scrivendo in un'enciclopedia migliaia e migliaia di voci su insetti. O sbaglio?
Mi pare siamo tutti d'accordo sul fatto che per voci da scrivere si stia parlando di voci enciclopediche, e che queste debbano contenere dati verificabili e non di fantasia. Scusa, ma ti ho dimostrato con il mio esempio specifico che il prelievo di un dato verificabile da una fonte attendibile senza una verifica incrociata su più fonti può produrre un falso.
infatti ho scritto che le liste dalle quali un eventuale bot dovesse prendere i dati dovrebbero essere controllate e considerate attendibili prima della pubblicazione. Ecco il punto dolente: quali sono le liste attendibili? Ti posso indicare almeno una decina di liste "ufficiali" in quanto prodotte da istituzioni governative, intergovernative, accademiche, ecc. (per definizione "attendibili") che sono reciprocamente incongruenti. Il motivo è semplice: la fonte primaria dei contenuti è il complesso della documentazione scientifica prodotta dal settecento ad oggi dalla quale si possono estrapolare i dati solo lavorando sul particolare ricostruendo la storia di un contenuto. Hai mai letto una pubblicazione di zoologia sull'istituzione o la revisione tassonomica di un animale? Non credo se pensi che le informazioni possano essere facilmente estrapolate da una qualsiasi lista: ogni anno vengono prodotte migliaia di pubblicazioni che producono nuovi contenuti o revisionano quelli precedenti, il riferimento a ciascuna pubblicazione viene inviato alla Commissione Internazionale per la Nomenclatura Zoologica e catalogato negli archivi delle pubblicazioni scientifiche in modo che la comunità scientifica sia a conoscenza della loro esistenza. Ciascun studioso che deve approfondire una tematica su una specie ha dunque sulla carta una lista non di nomi, bensì di pubblicazioni che trattano dei nomi correlati a quella specie e a sua volta produce altri contenuti. Il dinamismo è enorme perché ciascuno lavora in un ambito specialistico ristrettissimo, ma nessun aggregato globale è in grado di procedere aggiornandosi con la stessa velocità: per produrre una "lista" (le chiamano checklist) occorrono anni di raccolta dati (via umana) e quando sono prodotte sono già obsolete perché nel frattempo i dati sono già variati. Insomma, per capirci, qualsiasi lista è inaffidabile e richiede la verifica, nome per nome, da parte di un umano. Ma se l'umano deve verificare la validità di ogni record di una lista, a questo punto a che serve il bot? Stai orbitando intorno al problema senza focalizzarne il nodo cruciale! --2.39.237.219 (msg) 22:14, 25 apr 2013 (CEST)[rispondi]
Mah, a parte che l'opinione generale secondo me è già chiara nel paragrafo precedente, non credo che il problema sia il lavoro del bot: creare voci via bot si fa da anni ed è stato fatto anche su qui, se ci fossero grossi problemi di affidabilità credo sarebbero già venuti fuori. Imo il discorso è tutto sull'utilità stessa delle voci. Io personalmente ritengo siano utili anche se contengono informazioni minime, ma altri non sono daccordo e la questione secondo me è tutta lì. --^musaz 22:25, 25 apr 2013 (CEST)[rispondi]
All'IP, ma come faccio a farti capire che il tuo discorso non c'entra niente con quello che ho scritto? A me gli insetti non interessano. Vuoi dirmi che non è possibile per un bot creare milioni di voci sugli insetti perché non esiste al mondo una lista affidabile in quel campo? Va bene, allora non dovremmo farlo. Ma questo cosa c'entra? Riusciamo a fare un discorso più d'insieme sul futuro del progetto a prescindere dai problemi che ci creano le cavallette? È un'altro paragrafo, qui parlavo di altro, devo ricopiare tutto in una nuova pagina?
Musaz, purtroppo credo che la questione non sia tutta lì, altrimenti basterebbe una discussione e poi al limite una votazione, da ripetere magari ogni tanto. I microSTUB e la loro utilità sono una piccola parte del discorso, il punto è: come far crescere i contenuti in qualità e quantità senza che non si debba operare una scelta fra i due fattori? E come mantenerli entrambi inalterati nel tempo senza limitarne la crescita? La domanda mi è sorta ragionando su uno strumento in particolare (i bot che creano milioni di STUB al secondo) ma non è limitata a quello. --Phyrexian ɸ 22:54, 25 apr 2013 (CEST)[rispondi]
Terza divagazione OT dell'IP

[vado a capo] se ci fossero problemi di affidabilità credo sarebbero già venuti fuori. Musaz, scusa ma il problema di affidabilità esiste ed è venuto fuori, solo che sembra che siano tutti ciechi: basta confrontare le incongruenze fra le classificazioni che sono riportate nei vari progetti. Chiedo scusa per la lunghezza ma dato che si continua a parlare sull'astratto e sul generico senza solide basi sono costretto a mostrare casi di esempio. Confrontiamo queste voci:

  1. wiki inglese: en:Ephydridae. Fonte: una pubblicazione del 1987, il Manual of Nearctic Diptera, classificazione superata già dalla prima metà degli anni novanta, ma ancora adottata in alcune checklist on line
  2. wiki francese: fr:Ephydridae lista banale di generi presa da una checklist online piuttosto quotata, il Catalogue of Life, ma che estrapola le liste parziali da liste in parte obsolete. Ho individuato almeno un errore: riporta il genere Pelignellus che in realtà è diventato sinonimo di Atissa. La revisione non è disponibile online, ma sulla base di alcuni sospetti scaturiti dalla lettura di alcune recenti pubblicazioni, sospettai che il genere fosse stato sinonimizzato. Allora a suo tempo contattai il prof. Zatwarnicki, lo specialista mondiale della famiglia insieme a Mathis, e mi confermò che il nome del genere non è più valido perché sinonimizzato dal 1991. Tutti i ditterologi che pubblicano contenuti sugli Efidridi nell'ambito del genere Atissa adottano implicitamente la sinonimia da anni, tuttavia in diverse banche dati continua ad essere citato il genere Pelignellus. Non entro nel merito di altre eventuali incongruenze, ci vuole tempo per verificarle, ma il Catalogue of Life in questo caso specifico non è affidabile.
  3. wiki giapponese ja:ミギワバエ: riprende la stessa classificazione di en.wiki, quindi una classificazione taroccata perché obsoleta
  4. wiki norvegese no:Ephydridae: riporta una classificazione più corretta perché aggiornata, ma parziale perché la checklist riguarda solo gli efidridi presenti nel nord europa. A occhio credo che sia estrapolata da Fauna Europaea, che nel caso specifico adotta la revisione filogenetica di Zatwarnicki (1992) e il catalogo mondiale di Mathis & Zatwarnicki (1995), impianto ancora valido in generale, ma che ha subito piccoli aggiornamenti qua e là nell'arco di un ventennio.
  5. wiki russa ru:Мухи-береговушки: cita la revisione della famiglia di Zatwarnicki (1992), ma riporta un mero elenco di generi che, a occhio, mi sembra incompleto (e comunque vedo che anche qui c'è l'errore del Pelignellus)
  6. wiki svedese sv:Ephydridae: non riporta la suddivisione
  7. wiki italiana Ephydridae: riporta un elenco più articolato con l'indicazione anche delle sinonimie. La voce è stata creata da Eumolpo, ma l'impianto della classificazione si basa su una lenta ricostruzione che stavo facendo in itinere dal dicembre del 2010 all'agosto del 2011 spulciandomi decine e decine di pubblicazioni: preparando la voce sugli Ephydridae (mai pubblicata su WP) a dicembre del 2011 mi resi conto che la tassonomia estrapolata dalle liste on line era incasinatissima. Perciò l'ho ricostruita scrivendo le voci su ogni singolo genere consultando le pubblicazioni specifiche e gli aggiornamenti di revisione. Basti vedere la bozza "release candidate" della lista che riportai a gennaio in sandbox ([3]), con ancora diversi dubbi. Negli 8 mesi successivi quella lista è stata rimodulata e aggiornata man mano che acquisivo nuove informazioni dallo spulciamento della letteratura. Credo di essermi divorato diverse centinaia di pagine per venirne a capo e posso dichiarare con certezza che sul Web libero non c'è uno straccio di lista preconfezionata che non riporti errori (nella migliore delle ipotesi) quando non è completamente farlocca perché antidiluviana. La stessa lista su it.wiki non è pienamente affidabile perché mi ero fermato a metà del lavoro, come confermano i link rossi della voce, eppure ci sono voluti otto mesi per svilupparla.
I problemi, almeno nel contesto delle forme di vita, esistono, chi non li vede è perché non ha cognizione di causa ed è convinto che per risolverli basti prendere i contenuti da una lista univoca. Ma la lista univoca non esiste, rassegnatevi all'idea --2.39.237.219 (msg) 23:55, 25 apr 2013 (CEST)[rispondi]
Cancellare gli interventi degli altri non è un'azione consentita. Intanto ho ripristinato il mio ultimo intervento. Poi noto che insisti nel parlare di cose che non c'entrano nulla, grazie del tuo contributo nello stroncare la discussione. Se qualcuno è interessato a continuarla per me può tranquillamente cassettare questi interventi, altrimenti non fa nulla, lasciamo così com'è. --Phyrexian ɸ 00:57, 26 apr 2013 (CEST)[rispondi]
1) Da come ho interagito finora dovrebbe essere evidente che non era mia intenzione prevaricare cancellando interventi altrui. Lo so benissimo che non è un'azione consentita, hai provato a pensare che quello che è successo sia stato un errore accidentale? Non è la prima volta che succede e non sarà l'ultima. Chiedo scusa per l'incidente a cui hai comunque rimediato prima che intervenissero altri interlocutori.
2) Credevo che i miei interventi fossero on topic dal momento che parlando in generale hai citato esclusivamente come contesto d'esempio l'enorme mole di voci su insetti da sviluppare. Se poi ti riferisci all'uso di un bot per sviluppare - a suo tempo - l'insieme di voci sulle biografie dei nuovi parlamentari della prossima legislatura (giusto per fare un esempio), come non detto, ma sarebbe bene precisarlo quando si fanno degli esempi di contesti operativi per stabilire un efficace protocollo di comunicazione
3) Non sono un disfattista a priori, pensavo di offrire un contributo prospettando delle problematiche operative, ma, se ho disturbato la discussione, chiedo umilmente scusa e mi faccio da parte dopo aver cassettato i miei equivoci off topic. Non interverrò più se non chiamato esplicitamente in causa.
Ciao e auguri di buon proseguimento :) --2.39.237.219 (msg) 01:44, 26 apr 2013 (CEST)[rispondi]
Simpatia per l'IP: la discussione è stata comunque molto interessante, al di là di deviazioni dal topic, che comunque mi sembra si possa commentare così: la creazione di voci via bot va concordata con molta attenzione e in stretto legame al tema. La questione del patrolling ha un peso relativo, perché è raro che i vandali trovino soddisfazione nel vandalizzare una pagina dispersa come può essere quella di un cavalletta del lontano oriente. In ogni caso la filosofia che sta dietro il nostro progetto viaggia sul binario della fiducia, quindi non esiste alcuna voce che non dovremmo creare per paura dei vandalismi. Ciascun utente è libero di fare qualsiasi cosa, nel rispetto dei pilastri: nessuno può dire a chi crea voci su insetti dovresti piuttosto occuparti di progressive rock. Quando invece si parla di creare voci via bot, un ragionamento sull'utilità potenziale dell'iniziativa va fatto, e qui influiscono le aspettative dei nostri lettori. Ciò non significa che Justin Bieber diventi per questo più importante della legge salica, ci mancherebbe. Però usare i bot non è gratis, quindi imho è giusto avere in mente una sequenza informale di priorità: formattazioni seriali di voci sul progressive rock potrebbero essere valutate più importanti che la creazione seriale di voci. Sicuramente abbiamo capito che per la biologia la cosa non ha senso e credo che avremmo il dovere di comunicarlo ai ragazzi di nl.wiki. --pequod ..Ħƕ 02:21, 26 apr 2013 (CEST)[rispondi]
@Phyrexian: scusami, ma qui si stava discutendo della possibilità di creare con i bot delle voci su specie animali: si parlava quindi di un ambito ben specifico, ed è su questo tema che l'IP ha dato la sua opinone con ampie motivazioni, e non mi sembrava affatto OT (e mi spiace che abbia lui stesso cassettato i suoi interventi definendoli divagazioni OT, non lo erano). Piuttosto è il tuo discorso più ampio, altrattanto interessante, ma che tu stesso hai definito "Il discorso in generale" ("In sostanza il mio discorso è più sul futuro del progetto che sui grilli di questi giorni") che andrebbe affrontato in una diversa pagina. --Eumolpa (msg) 10:26, 26 apr 2013 (CEST)[rispondi]
Intanto mi scuso con l'IP se sono stato un po' brusco, ma dopo l'insistenza nel proporre argomentazioni valide e dettagliate, ma che nulla c'entravano col mio discorso, mi vedo anche sparire un mio commento, e francamente mi sembrava una trollata bella e buona. Poi se dici che non l'hai fatto apposta amen, scuse accettate, tu accetta le mie. :-) @Eumolpa, si stava discutendo di diverse cose in modo un po' confusionario, non c'erano proposte concrete, mi sembrava una spece di brainstorming collettivo, in cui ognuno ha lasciato le proprie idee in libertà. Nulla di male anzi, ma proprio perché io intendevo andare un po' OT e fare un discorso più generale ma più preciso ho aperto un nuovo paragrafo. La discussione precedente poteva e può benissimo continuare nel paragrafo precedente. Sì avrei potuto aprire una nuova pagina, ma avrei spezzato la discussione, (il mio ragionamento in generale trae comunque spunto dalla questione dei bot discussa in questa pagina), e poi questa pagina era abbastanza partecipata, una nuova con un argomento così generale forse sabbe stata un po' ignorata. E poi siamo al Bar, mica in chiesa... Perché è così difficile discutere di qualcosa senza prima parlare di come/dove/quando/perché discuterne? Nessuno mi ha ancora lasciato un feedback sul mio ragionamento. Ok tranne Pequod, ma l'avrà fatto solo per una sorta di solidarietà fra grafomani. XD --Phyrexian ɸ 15:52, 26 apr 2013 (CEST)[rispondi]
nl.wiki ha dei seri problemi di qualità, molti dei suoi parametri "generali" (orfane, disambigua, edit per pagina...) sono totalmente sballati... secondo me hanno fatto un grave errore a ficcarci a freddo un'altra catervata di voci.
Per quanto mi riguarda mi sono dato alla connettività per fra crescere it.wiki in modo organico e robusto, purtroppo non abbiamo linea editoriale e mi è sembrato il modo più "neutrale" di fornire "controllo" e/o "efficienza" (quale sia il valore che ci vogliamo articolare, non partite con i distinguo vi prego) senza imporre appunto uno schema predefinito (anche se spesso aver espresso sintesi di certe dinamiche le ha portate a dipingerle come "una posizione personali" anche se erano lo strumento più neutrale che avevo di essere il più aderente possibile all'oggettività del progetto, ma tanto è...)
Personalmente penso che gli inserimenti di bot vanno fatti col contagocce e con una chiara pianificazione, con il vincolo che le voci vadano viste a una a una. Il fatto che non siano orfane o mal connesse è fondamentale, se lo sono è come non averle perché tanto nessuno passa a editarci (la correlazione fra la connettività e le visite è netta, e sto stimando quella fra connettività e modifiche, ma non mi apsetto sia diversa). Le orfane di minerali ce le siamo tenute sul groppone per 7-8 anni, e lo stesso vale per i vini e per certe voci di cortometraggi. Cose del genere non devono avvenire mai più, "senza se e senza ma" se mi permettete l'imperiosità dell'affermazione. Se vogliamo far correre un bot accertatiamoci che quelle voci non siano un corpo estraneo. va bene se sono minimali, ma non devono essere estranee. Il bot deve quindi sempre essere un velocizzatore di un lavoro che un utente farebbe comunque. Se l'utente X stava per scrivere 100 stub di Y con 4 o 5 fatti meglio (che poi qualcuno potrà spulciare per capire che fonti avere, come ampliare), mi sta bene che lo faccia il bot per agevolare il suo lavoro. Se non c'è un(')utente che se ne occupa, allora la mia posizione è tendenzialmente contraria--Alexmar983 (msg) 22:19, 27 apr 2013 (CEST)[rispondi]
Sull OT del controllo dei cotributi
2) se il numero di utenti e di admin non tiene il passo con le voci bisogna investire le energie meglio. Io sono un grande sostenitore della wikificazione dei contributi dei novizi, e per tanto ho sempre lottato perché i meccanismi del lavoro sporco siano resi mirati. E ne discuteremo a lungo in altre occasioni Fermo restando che l'efficienza, come nel caso dei BOT si chiede dove serve, e si motiva perché serve. Del resto io non ho mai sostenuto automatismi, ci sono tanti modi di essere mirati pur rimanendo flessibili. basta avere la certezza di farlo quando serve (a scanso di equivoci, io NON sono un supporter dell'efficienza in quanto tale, posso perdere ore a fare qualcosa, ma una cosa è il tempo mio, e un'altra quello di tutti).
3) a me non sembra che la situazione sia catastrofica, tutt'altro. Io ho trovato voci impresentabili abbandonate nei meandri di wikipedia che oggi vengono cassate in pochi giorni, e so di cosa parlo perché ho confrontato la situazione per mesi. Ho individuato pagine critiche e ho tenuto d'occhio se venivano cancellate o "templatate". E a essere sinceri, siamo al 100% di individuazione per le nuove voci (sulle modifiche non so), ergo sono quanto meno ottimista sui meccanismi di controllo, e sinceramente non vedo criticità a breve. Certo se mettessimo dei numeri nero su bianco sarebbe meglio, ma se alcuni pensano che sia contro lo spirito di questo progetto, temo che si congetturerà sulle congetture. Comunque per quanto ho visto io il sistema regge, i pochi utenti presenti si "adattano" ai nuovi carichi di lavoro.
4) Certo, in larga maggioranza il problema deriva comunque da IP "occasionali" e utenti con pochi edit alle spalle, che però a me stanno tanto simpatici. Che erano il nocciolo del progetto l'ho sempre pensato. la verità è che i vecchi utenti fanno spesso le stesse cose, sono gli IP sporadici e gli utenti a bassa intensità a ricordare a wiki "di apririsi a quello che manca".
5) evitando di entrare nel dettaglio dei problemi relativi all'alto numero di voci se gli utenti non crescono bisogna aver chiaro come quantificare questa criticità prima di "cambiare qualcosa", dovrebbe essere qualcosa di non emozionale, qualcosa che se raggiungiamo questo tipo di livello di problema allora lo facciamo. Per me il "piano B" potrebbe essere qualcosa di simile al meccanismo appplicato su altre wiki per le versioni non verificate, che sono segnalate ma non immediatamente visisbili previa approvazione di un altro utente registrato. Con una buona quota di autoverificati, il tempo medio di verifica per pagina prima della pubblicazione definitiva non eccede mai 3-4 giorni. certo gli Ip possono modificare ma non vedere subito la loro modifica, e questo potrebbe risultare frustrante, d'altro canto il numero di contributi di IP per esempio su de.wiki non è così basso. Ma appunto è la "mia idea" piano B, che penso al momento comunque non occorra, e forse alla fine potrebbe anche non occorrere in futuro.
&) Sempre in tale ambito l'autoverifica, che serve di fondo a mirare il lavoro di patrolling, dovrebbe secondo me restare ma essere molto più severa. Ma ne parleremo in altra sede. Aspetto di vedere come si comportano nei prossimi mesi le decine di persone che ho proposto, e soprattutto la natura delle revoche, per vedere come il sistema possa essere ancora migliorato.--Alexmar983 (msg) 22:19, 27 apr 2013 (CEST)[rispondi]
  • Dico la mia: premetto che la qualità di una wiki IMHO non dipende dal numero di voci e francamente mi importa poco di guardare a numeri simili. Credo che se l'argomento di cui si parla è enciclopedico, non ci trovo nulla in contrario alla creazione di voci via bot. Gli esempi riportati in precedenza (chiedo scusa, non riesco a trovare da chi all'interno della discussione) valgono poco: il confronto non è tra una voce buona e un micro stub, ma tra una voce che non c'è e una che c'è.
D'altro canto bisogna valutare i pro e i contro e adottare le contro misure. Tra i contro vedo due problemi: la difficoltà a controllare queste voci e il fatto che spesso un link rosso è uno stimolo a creare, mentre una voce in pessime condizioni può scoraggiare i contributori. Sul primo punto credo che si possa risolvere in questo modo: se un progetto decide di creare voci con un bot allora tutti i partecipanti a quel progetto hanno il dovere di inserire quelle voci negli Osservati Speciali (si tratta di fare copia / incolla); in questo modo le voci sono controllate da un numero adeguato di persone. Per il secondo punto credo che il problema non si ponga perché il bot si limiterebbe a riempire l'infobox (spesso è la cosa più complessa e noiosa per un utente).
Concordo, infine, con Jalo sul discorso wikidata.
Chiudo con un OT: non credo che abbia molto senso mettere in relazione il numero di admin col numero di voci, ma piuttosto è più corretto guardare al numero di contributori, meglio ancora (come detto da Alexmar983) col numero degli autoverificati, e dei contributi. È più difficile gestire 100mila voci che "subiscono" 3 edit al giorno piuttosto che 1 milione che ne ricevono 3 al mese. --Cpaolo79 (msg) 10:39, 29 apr 2013 (CEST)[rispondi]


Sento il dovere di esprimere la mia su questa questione, e di separare adeguatamente l'intervento dagli altri. Ammetto di non essere riuscito a leggere tutto il testo fino in fondo, ma proverò a trovare una soluzione comune tra le varie opinioni.

  • La quantità non dovrebbe prevalere sulla qualità (lo credo un principio innegabile);
  • Non mi dispiacerebbe avere molte più voci di de.wiki, nl.wiki e en.wiki, a patto che siano complete e affidabili;
  • Personalmente trovo inutile la creazione in massa di decine di migliaia di voci, seppur enciclopediche
    dato che la maggior parte sarebbero e resterebbero stub per anni, probabilmente inutili alla stragrande maggioranza dei fruitori dell'enciclopedia, siano essi "comuni profani" o specialisti in quel campo.

Detto questo, focalizzo un approfondimento su Wikidata (vengo da quelle parti :-)) e le risorse strutturate in genere.

  • Wikidata contiene dati strutturati, cioè in formato perfettamente consultabile e comprensibile da programmi automatici, quanto anche dagli umani, mediante un'interfaccia grafica;
  • è stato proposto da alcuni utenti (e anche da me personalmente), a mio parere con molto buon senso, di terminare/unire Wikispecies in Wikidata o cose simili;
    per ulteriori informazioni segnalo questo commento e questa discussione, oltre naturalmente a quest'altra su Wikidata (tutto in inglese)

Credo che la cosa migliore sarebbe quella di lasciare a Wikidata quello per cui è stato creato, cioè tutti i dati (tassonomia, ecc.) facilmente inseribili come proprietà od altro. Per esempio SamoaBot importa il nome scientifico e il livello tassonomico.


La mia proposta, organicamente, è che la creazione di voci sia lasciata agli utenti "normali", registrati o meno, i quali, una volta riscontrata la disponibilità e la verificabilità di informazioni rilevanti e non strutturabili riguardo una particolare specie, abbiano a disposizione uno strumento semi-automatico che inserisca un template ad hoc senza parametri, che a sua volta visualizzi i dati tassonomici in tempo reale da Wikidata.


Commentate pure. --Ricordisamoa 14:58, 29 apr 2013 (CEST)[rispondi]