Wikipedia:Bar/Discussioni/Alcuni dati sulle voci senza fonti

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Alcuni dati sulle voci senza fonti



Questa segnalazione prende origine da qua Wikipedia:Elenchi_generati_offline/Richieste#Voci_senza_fonti. Stavo studiando alcune ipotesi operative per i futuri festival della qualità ora che sono ripresi in modo ciclico. un rigraziamento a valterVB e incola per i dati che sto per dirvi

Ho scoperto cose molto interessanti. Vediamo ai numeri:

1) wikipedia ha 55741 voci che sono con un template F e che presumo al 99% se lo meritino (non mi sembra che la rimozione del template F sia un gesto particolarmente diffuso, in mesi che guardo le modifiche, se non i casi critici di lotte su template E da IP o utenze aggressive, altamente monitorati). Non dubito quindi che un 5% di voci sicuramente si merita una bella F perché di fonti ne ha al massimo 1 striminzita.
2) ci saranno anche voci con poche fonti senza la F, ma al momento mi concentrerei su questi casi seri (vedi punti seguenti). Non escludo comunque di parametrizzarle un giorno chiedendo un EGO del tipo "voci con più di 5 kb, e solo una fonte in "note" e nessuna "sezione bibliografia" (o simile).
3) nel 2012 ho scoperto che le voci senza fonti e bibliografia ma con template F (escluse alcune tipo le date, come ha fatto notare Incola) erano 81111 ma a causa della grandezza dell'output l'EGO non fu mai archiviato. La buona notizia è che l'aumento dei lavoro sporchisti, l'efficienza delle PdC nell'eliminare voci senza fonti non enclciopediche e nel fontare quelle che lo sono, la ripresa dei festival della qualità etc etc oggi le hanno portate a poco più di 30000. Quindi la nostra efficienza nell'individuarle i casi più seri è molto buona e in teoria un vero festival di inserimento del template F potrebbe non essere strettamente necessario. Mi proponevo di riverificare fra 3-6 mesi se il ritmo di segnalazione procede con questa "efficienza". In effetti io da solo in 48-72 h ne avrò segnalate almeno 3, quindi penso proprio di sì.
4) tuttavia c'è una cattiva notizia: le voci senza F e fonti che esitono in altre lingue sono... QUASI TUTTE! Questo significa che
4a) in primo luogo siamo molto efficienti a cancellare più facilmente quelle senza fonti che esistono solo in italiano. nel senso che se non hanno fonti ma esistono altre lingue è più facile (logicamente) trovarne. Si tratta di una questione statistica, esisteranno sempre casi di voci cancellate in italiano ma che rimangono in altre lingue, ma a parte inserimenti promozionali spammati interwiki si tratta di disquisizioni su cosa vogliamo come enciclopedia, non delle fonti che si trovano (che anzi in voci quali eventi e mogli di... abbondano)
4b) c'è temo una tendenza a considerare "meno grave" la mancanza di fonti in una voce che esiste in altre lingue. Questo mi preoccupa, una voce presente in molte lingue è sicuramente a livello "statistico" importante e quindi visitata più delle altre. Come è possibile che ci dimentichiamo non dico le fonti, ma persino di inserirci la F?
4c) da una scorsa veloce (e incompleta) mi pare che siano poco fontate le voci di televisione, eventi sportivi e matematica. Matematica è una vecchia conoscenza e risente della flessione nei contributi nel settore avvenuta a partire dal 2008 (caso classico le voci non editate da più tempo, dove matematica come informatica e diritto è molto presente). Nel caso di televisione, e eventi sportivi spero sia solo un effetto della loro maggior epresenza in ogni caso. In effetti conta la differenza fra questo insieme e quello delle voci totali come presenza, e non mi sembra troppo dissimile.

Faccio notare che sommando i 55741 con F e 30000 e passa dell'elenco si arriva all'8.5% delle nostre voci, che è ancora tanto. Passino le gare di tennis o che altro dove penso reperire un almanacco non sia improbabile a chi le ha scritte, ma il caso di voci come Adam Mickiewicz sono secondo me più serie.

Si accettano strategie per far rentrare il problema

Secondo me fra efficienza delle PdC, controllo dei non autoverificati, lavoro di alta qualità dei progetti attivi etc l'inserimento di nuove voci totalmente senza fonti non è troppo critico. Intendo, non dico che siano meno dell'8% delle nuove voci, ma spesso si beccano tanto la F che la W e la E, la S, e entrano in un ciclo di revisione costante che cura questo aspetto (eliminandole, migliorandole, spedendole in futuro si spera a un festival). Può darsi anche che mi sbagli, ma mi preoccupano di più al momento quelle storiche, anche perché spesso sono "meno da almanacco" (la soglia di cosa si inserisce su wiki tende a abbassarsi).

Io pensavo per sensibilizzare la comunità sui casi più gravi "mediaticamente", di fare un festival della qualità di inserimento di F e almeno di qualche fonte alle voci senza fonti che esitono in più di 50 (!) lingue, ma si accettano altre idee.

Solo quando le voci totalmente prive di fonti (non necessariamente prive di F) saranno scese sotto il 1% potremo secondo me inziare a riflettere su come aumentarle ancora, le fonti presenti. Del resto inserire una sintassi per le note e le bibliografie è importante epr stimolare l'inserimento di note e bibliografie ulteriori, anche se la voce ne è globalmente carente. È evidente che per un novizio è più facile sapere come si inserisce ref, "cita pincopalla" etc se ha almeno un esempio nel codice sorgente.--Alexmar983 (msg) 21:13, 29 giu 2013 (CEST)[rispondi]

Parlo per le voci calcistiche: abbiamo qualche migliaio di voci di edizioni di campionati e coppe nazionali lunghe qualche kb e in apparenza senza fonti: tuttavia le informazioni sono presenti nei link indicati nei collegamenti esterni che dovrebbe esserci. Siamo quindi in presenza di voci senza fonti e bibliografia ma comunque verificabili e se facessi l'EGO di cui parli avresti migliaia di falsi positivi. --RaMatteo 10:06, 30 giu 2013 (CEST)[rispondi]

Capisco per date e anni, ma per le voci di campionati e coppe non capisco che problema ci sia a riportare le fonti anche lì senza dover stare a controllare tutte le voci collegate in cerca della fonte che cerco, sempre che la trovi....--151.67.197.169 (msg) 10:16, 30 giu 2013 (CEST)[rispondi]
Faccio un esempio: questa è di 6,5 Kb, non ha fonti ed è fatta secondo lo schema incipit+formula+squadre+classifica+verdetti+marcatori, tutti riportati nei due (autorevoli) collegamenti esterni. Le fonti in senso stretto dove dovrebbero essere e a cosa servirebbero? Sarebbero una ripetizione dei due link a disposizione per chi, ad esempio, vorrebbe vedere i risultati che non abbiamo in voce. --RaMatteo 11:37, 30 giu 2013 (CEST)[rispondi]
In questo caso a mio parere sarebbe opportuno riportare sotto forma di note i link presenti nei collegamenti esterni. Questi infatti dovrebbero essere solo di approfondimento, ma se sono stati utilizzati per la stesura delle voce e sono autorevoli, perché non usarli in maniera puntuale? Forse non è questo il caso, ma se si facesse così, avremmo anche il vantaggio di individuare quali parti di testo o quali tabelle (giusto per fare un esempio) necessitano di riferimenti oppure avremmo la certezza che la voce è ben fontata nel suo insieme e in maniera precisa.--Dome A disposizione! 12:00, 30 giu 2013 (CEST)[rispondi]
(fuori crono) Vero, ma in certi casi è proprio impossibile farlo: nell'esempio la voce ha tra i collegamenti esterni una pagina di RSSSF.com che contiene risultati, classifica finale e classifica marcatori, mentre la voce contiene classifica finale e classifica marcatori: cosa facciamo, mettiamo un "ref" per ogni riga che scriviamo, tutti allo stesso link?
D'altro canto come dice Alexmar983 più sotto l'EGO fa riferimento a voci che non hanno i Collegamenti esterni, come è giusto che sia: piuttosto la presenza della sola sezione note potrebbe non significare nulla, perché quelle presenti potrebbero essere solo note di puntualizzazione del testo, ma non fonti. Viceversa una voce che contiene l'elenco degli incontri di una squadra sportiva potrebbe all'apparenza non avere fonti ed averne in realtà diverse decine perché sfrutta il campo "Referto" del {{Incontro di club}}.
Quindi, buona la base di partenza, ma bisogna poi valutare caso per caso. --Cpaolo79 (msg) 09:09, 1 lug 2013 (CEST)[rispondi]

Alcune precisazioni:

a) che io sappia l'EGO indica le voci che non hanno nemmeno collegamenti esterni, a parte caso di usi impropri di titoli (tipo "fonti") o wikificazioni incomplete, che comunque vanno stanati, parliamo di voci senza nulla di nulla;
b) infatti il mio intervento si riferisce all'assenza TOTALE di qualsiasi informazione. Se esistono voci a cui è stata apposta la F pur collegamenti esterni, meglio per noi, significa che la situazione è meno critica;
c) rimane comunque il fatto che le voci senza uno straccio di verifica sono davvero troppe ancora, potremmo fare un EGO "hanno collegamenti esterni + template F" ma cambia poco, non mi aspetto che scendano sotto il 6-7%.
d) e sono ancora in maggioranza voci presenti in molte edizioni linguistiche.

per questo la mia proposta è un festival che ponga alta l'attenzione sull'argomento, per iniziare da qualcosa che sia anche solo inserire la F. Poi ogni progetto si regolerebbe in sede di festival come vuole. io le voci di calcio o tennis tranquilli che non le tocco...--Alexmar983 (msg) 14:17, 30 giu 2013 (CEST)[rispondi]

sull'esempio di Adam Mickiewicz, io spesso ricorro ad una soluzione temporanea come {{Treccani|adam-mickiewicz}} , anche se delle volte la voce su Enciclopedia Treccani e' molto piu' striminzita di quella su wiki. --Rago (msg) 15:09, 30 giu 2013 (CEST)[rispondi]
Io ho notato che moltissime voci di medicina (temo la maggior parte) non hanno fonti (o ne hanno giusto due o tre), ma, poiché scritte molto bene e ricche di informazioni, sono prive del template F. Ad esempio, le prime che ho trovato: Epatite, Glomerulo, Sistema nervoso ortosimpatico... --Manfre87 (msg) 20:46, 30 giu 2013 (CEST)[rispondi]
Purtroppo nei primi anni di it.wiki non si è dato importanza alle fonti, e ancora ce ne portiamo dietro le conseguenze. Quando ho cominciato a contribuire, il F (che si chiamava credo "Senzafonti") era usato in poche centinaia di voci, neanche un centesimo della verità, e io stesso non lo inserivo, perché non dava l'impressione di essere importante. Per questo appoggio la proposta di Alexmar983; quando quasi tutte le voci senza fonti avranno il loro F, il messaggio sarà più efficace --Bultro (m) 11:39, 1 lug 2013 (CEST)[rispondi]

[ Rientro] Mi spiace dare una brutta notizia, ma ho scoperto che l'elenco precedente non era corretto: il software aveva limitato i risultati ai primi 30000, ma in realtà i risultati (le pagine senza fonti) sono in totale circa 77000 (elenco corretto). Questo elenco si riferisce alle pagine che non contengono avvisi di servizio e non contengono le sezioni note, bibliografia o collegamenti esterni. --Incola (posta) 18:55, 1 lug 2013 (CEST)[rispondi]

saro' pessimista, ma secondo me la situazione e' ancora peggiore. Molto spesso i link indicati come fonti si riferiscono a siti non piu' online oppure, nelle voci tradotte, si tratta di un mero copincolla dei collegamenti presi dalla voce originale con link a fonti non in italiano che sono o non consultabili da chi non conosce la lingua della fonte oppure semplicemente non rispecchiano lo stato attuale della voce. Quindi voci apparantamente fontate ma in pratica no. Anch'io come sopra in passato non mettevo l'avviso, ora ogni qualvolta creo una voce nuova - di solito scorpori da voci piu' grandi - metto sempre l'avviso di mancanza fonti. Certo che sarebbe meglio mettere le fonti, ma faccio quello che posso. --Rago (msg) 07:57, 2 lug 2013 (CEST)[rispondi]
Marcare 77.000 voci che non hanno proprio niente di niente sarebbe un buon inizio.
Se facessimo inserire l'F da un bot? Ci saranno sicuramente dei casi in cui non va messo, ma è meglio togliere a mano gli F di troppo da 1.000 voci che metterlo a mano in 77.000! Magari possiamo cominciare con controllare a mano un "campione" di voci per renderci conto delle proporzioni --Bultro (m) 12:16, 2 lug 2013 (CEST)[rispondi]
@Bultro: Vigevanese fece la stessa proposta 7 mesi fa: la mia proposta era di dividere le pagine (che all'epoca erano più di 80mila) per progetti di competenza. --Cpaolo79 (msg) 12:43, 2 lug 2013 (CEST)[rispondi]

(rientro) vedo di fare il punto.

1) La situazione è messa abbastanza male, ci sono molte più voci del previsto in stato pessimo. Peraltro, ci sono anche EGO che sono stati fatti per sbarbare i link promozionali, e che potrebbero portare a sguarnire qualche altra voce in più. Senza contare appunto che le Note possono anche non essere fonti. Nel complesso sfondiamo il 13-14% di voci totalmente sguarnite di supporti, e molte non segnalate;
2) sono appena rientrato e non ho letto la vecchia discussione. Ritengo preoccupante il fatto che non si sia "agito". -4000 voci in 7 mesi a cui è stata apposta la F non è male ma sono "tempi di rientro" inaccettabilmente lenti.
3) Difficile limitare il tutto a una dimensione "manuale" da festival; è sempre fattibile come ho detto con le voci presenti in più lingue, restringendo l'elenco e penso che lo farò. A questo punto tuttavia lascerei stare la questione della F, mi concentrerei e basta sul problema fonti, per il festival, voci senza nulla presenti da 40 lingue in su, prioritarie. Fra i suggerimenti potremmo mettere o di segnalare (almeno) o di mettere come Rago ha suggerito il link alla Treccani o a altre enciclopedie.
4) focalizzarsi sui singoli settori penso sia possibile, se mi ricordo la richiesta del vecchio EGO Salvodapalermo aveva chiesto un EGO per le biografie di calciatori;
5) il bot credo funzionerebbe solo se ci fossero altri avvisi da cui "rubare" l'arg del template. Pil56 aveva detto che aveva abbastanza standardizzato le categorie di lavoro sporco. Si può chiedere, ma risolverebbe solo una parte del problema, le voci che hanno una S o una W credo (le E in genere sono pochi e hanno spesso anche la F). Non mi dispiacerebbe perché volevo proporre un "festival delle pagine con più di X avvisi", e aiuterebbe a avere chiara la situazione.--Alexmar983 (msg) 17:37, 2 lug 2013 (CEST)[rispondi]
Sì, è possibile focalizzarsi su singoli settori. Bisogna solo individuare un template o un testo che si trova in tutte le pagine di un certo argomento (per esempio le voci di matematica potrebbero contenere un <math>). --Incola (posta) 17:57, 2 lug 2013 (CEST)[rispondi]
suggerisco che su tale dimensione si propongano i singoli (sotto)progetti, io invece mi dedicherei a preparare un ego per le "sguarnite-presenti-in-troppe-lingue-per-non-essere-oggettivamente-importanti", calibrandolo sulla giusta dimensione operativa. Sarebbero utili dei pareri aggiuntivi sulla ipotesi bot, come ho detto credo che ci siano resistenze tecniche ma la standardizzazione di alcune cat di lavoro porco portata avanti da Alessiomela e Pil56 penso aiuterebbe. --Alexmar983 (msg) 18:13, 2 lug 2013 (CEST)[rispondi]
L'argomento degli avvisi non è obbligatorio; meglio un avviso senza argomento che nessun avviso. L'argomento può essere ricavato dai bot in base a altre categorie e template presenti nella pagina, ma questo si può fare anche in un secondo momento (e non solo per F) --Bultro (m) 12:45, 3 lug 2013 (CEST)[rispondi]
ok se c'e' consenso va bene anche la F senza arg. Di fondo ho iniziato a mettere arg2 alle W, quindi posso metterli anche alle F, e io come molti altri (anzi contatto Alessiomela e Pil56). Ma SE vedo che le 80000 F non categorizzate non scendono abbastanza rapidamente di numero, allora proporrò un festival per categorizzarle manualmente eliminando i falsi positivi.--Alexmar983 (msg) 15:37, 3 lug 2013 (CEST)[rispondi]
Per quanto riguarda l'argomento, col mio bot posso facilmente metterlo a quelle voci che hanno certi template (es. biografie, aziende, geografia, etc.) o il cui argomento rientra in una macrocategoria "piccola" (es. mitologia, araldica, etc.). A quel punto resteranno fuori ancora diverse voci, ma si smaltirebbe facilmente una grande fetta di lavoro. Inoltre il bot di Pil56 è in grado di migliorare l'argomento "biografie" in qualcosa di più specifico (es. scrittori, atleti, etc.). --AlessioMela (msg) 18:32, 3 lug 2013 (CEST) [rispondi]
Allora bot automatico F + data e poi giu' di arg con altri bot e manualmente? Si tratta di una cosa grossa qualche altro parere sarebbe auspicabile prima di inoltrarla ai botolatori--Alexmar983 (msg) 11:53, 4 lug 2013 (CEST)[rispondi]
Magari cominciamo col far bottare un assaggio (200 voci?) per vedere cosa viene fuori --Bultro (m) 14:45, 4 lug 2013 (CEST)[rispondi]
A livello pratico sarebbe meglio far fare tutto allo stesso bot (meno edit, meno possibilità di confusione).
@Bultro mettere l'argomento "automatico" a 200 voci a caso è un lavoraccio. La cosa ha senso su un numero di voci che si aggira nell'ordine delle migliaia o più (proprio perché è automatico fino ad un certo punto, insomma ogni argomento va a sé e il bot va calibrato di volta in volta, spero di migliorarlo in futuro). Te lo dico per esperienza perché l'ho già fatto con il template {{O}}. Tant'è che adesso che sono a regime con le orfane (vanno aggiunti un centinaio di template un paio di volte al mese), in automatico posso fare poco, per lo più li metto in semiautomatico. Quindi se come esempio vi vanno bene gli edit sui template delle orfane (vedi AlessioBot, soprattutto nel blocco di lavoro di qualche mese fa) il mio bot sarebbe già pronto per agire sulle F se mi dite di preciso quali pagine devo prendere perché non vorrei confondermi tra i vari elenchi. --AlessioMela (msg) 15:04, 4 lug 2013 (CEST)[rispondi]
Non stavo parlando affatto di argomento, la proposta operativa è di inserire F senza l'argomento. Se si riesce a mettere direttamente anche l'argomento meglio ancora, ma che non diventi uno scoglio per cui alla fine non si combina niente --Bultro (m) 15:49, 4 lug 2013 (CEST)[rispondi]
Non litigate! :) davvero mettere la F senza arg per me va bene, se volete farlo con un test in una categoria piccola vi suggerisco le voci della categoria:cucina che controllo personalmente, ok? Poi una volta fatto il test, si passa a tutte e 77000, e poi Alessiobot e Pil56bot inizieranno a mettere le arg, nei limiti del possibile. Io guarderò la categoria Categoria:Senza fonti - argomento sconosciuto e monitorerò il suo andamento. Con altri utenti inseriremo arg manualmente e revisioneremo i falsi positivi. Se vediamo che non le smistiamo tutte al "giusto ritmo", facciamo un festival.--Alexmar983 (msg) 16:03, 4 lug 2013 (CEST)[rispondi]
Non è uno scoglio invalicabile mettere l'argomento. Lo si mette solo dove si riesce e le altre avranno l'avviso senza argomento. Se vuoi procedo con 200 voci senza argomento, ma non so che senso possa avere. Il bot prende queste 200 voci e a tutte mette in cima {{F||luglio 2013}}. Capisco che l'idea di base sia metterlo senza argomento. Ma se invece di mettere 80mila argomenti a mano ne mettiamo solo 10mila direi che è tanto di guadagnato. --AlessioMela (msg) 16:07, 4 lug 2013 (CEST)[rispondi]
ok, chiaro adesso. Prova con le voci della categoria "cucina". Prendi quelle senza F ma anche senza "note", "bibliografia", "collegamenti esterni" e mettici la F avente come arg cucina.--Alexmar983 (msg) 16:12, 4 lug 2013 (CEST)[rispondi]
Ok, prendo l'elenco di Incola, lo interseco con le voci che si trovano ricorrendo su cat:cucina e tutte le sue sottocategorie e a quelle metto l'avviso F con argomento "cucina". --AlessioMela (msg) 16:25, 4 lug 2013 (CEST)[rispondi]

Partito, le voci di cucina trovate in quel modo sono 863. Fatemi poi sapere per le altre come regolarmi (quando partire e se farne solo alcune o tutte) in base a questo giro. --AlessioMela (msg) 16:44, 4 lug 2013 (CEST)[rispondi]

baco n.1 Abricotine, alcune voci hanno un "senza fonti" per intero non una F e ci sono dei doppioni.--Alexmar983 (msg) 16:52, 4 lug 2013 (CEST)[rispondi]
Il senza fonti era già presente. Probabilmente l'elenco non lo escludeva. Devo escludere le voci che hanno già un "senza fonti"?
Non ho capito se la cosa dei doppioni è lo stesso discorso o un altro. --AlessioMela (msg) 16:56, 4 lug 2013 (CEST)[rispondi]
Senti non capita molto spesso, non mi sembra la fine del mondo. Altri bachi non ne vedo. Direi che in modo controllato la cosa è fattibile. So quali progetti "di nicchia" possiamo importunare. Per il rafinamento degli arg penso ci siano margini anche via Bot (categorie geografiche, o anche dai portali richiamati)--Alexmar983 (msg) 16:59, 4 lug 2013 (CEST)[rispondi]
Sta andando piuttosto bene! "Senza fonti" è quasi estinto, non me ne preoccuperei. Per controllare le voci potremmo suddividercele per lettera --Bultro (m) 17:05, 4 lug 2013 (CEST)[rispondi]
(confl.) Ci sono circa 50 "senza fonti" (in tutte le sue forme) in tutta itwiki, siamo stati sfortuati in quel caso. Comunque adesso dovrebbe tenerne conto. Ah, per l'argomento: partendo da certuni è più probabile evitare i falsi positivi. Ad esempio qualche pianta mi sa che è finita tra le voci di cucina. Non che sia tutto sto problema, tanto lo scopo è che si veda la F, però se procediamo in un certo ordine (in questo caso sarebbe stato comodo prima botanica, poi cucina) si hanno argomenti più mirati. Ma questa è proprio una finezza. --AlessioMela (msg) 17:07, 4 lug 2013 (CEST)[rispondi]
Procedendo un argomento alla volta, anche solo guardando i contributi del bot qualche titolo fuori posto si potrebbe vedere a occhio. Che poi è un po' la stessa cosa che ha detto Bultro :-). --AlessioMela (msg) 17:10, 4 lug 2013 (CEST)[rispondi]

Dopo questo "primo round", come pensate sia bene procedere? --AlessioMela (msg) 18:30, 4 lug 2013 (CEST)[rispondi]

possiamo farlo correre a gruppi di 500-1000 pagine ogni 3-4 giorni. Del resto, se usassimo arg troppo generici ci troveremmo troppe pagine da visionare. Il "progetto cucina" a livello di lavoro sporco "di fatto" sono "io", posso chiedere a 1felco di controllare i formaggi, a Bigfan le voci piu' "sociali" e a qualcun altro quelle alcoliche, ma ci serve adesso un altro test con un progetto attivo medio-piccolo e molto disposto sull'argomento di cui noi non facciamo parte, ho qualche proposta. Purtroppo sono arg specifici, ma finche' ci sono utenti che li revisionano a mano non dobbiamo preoccuparci troppo se capita come le piante che l'arg sia poco mirato. Possiamo provare piu' pagine alla volta con arg generici solo se ci sono progetti molto frequentati consensienti (tipo calcio), ma quello lo farei come seconda fase. E poi come terza fase quando (se?) il rapporto costi/benefici semra diventare sconveniente perche' ci sono troppe imprecisioni, per le ultime (decine di?) migliaia mettiamo solo la F e facciamo un festival per inserirlo a mano. --Alexmar983 (msg) 18:48, 4 lug 2013 (CEST)[rispondi]
Faccio fatica a vedere una partecipazione collettiva e attiva alla cosa. Sicuramente il festival della qualità sarà una soluzione, ma avere l'appoggio dei vari progetti mano a mano che scorriamo gli argomenti la vedo difficile. Penso sia più probabile un intervento disomogeneo e non organizzato.
Con questi numeri (più di 100mila totali), le categorie del lavoro sporco sulla F saranno abbastanza intasate. Per cui cambiare mano a mano i vari argomenti in quelli migliori in assoluto, secondo me è uno spreco se (e solo se) rallenta la diffusione delle F. Magari molte F si risolvono prima ancora di aver messo/sistemato/controllato l'argomento. Questo lavoro è da fare ed è essenziale per avere una panoramica o per agire settorialmente, ma dal ns0, per aggiungere le fonti, non è necessario che il template sia perfetto.
Tutto questo per dire che sono d'accordo con Bultro quando dice che la priorità è mettere la F per mandare il messaggio: "qui mancano fonti!" o, più nel sottile, "su Wikipedia le fonti sono necessarie, non facoltative". Mentre ottimizzare la categorizzazione interna del lavoro sporco si può fare come appoggio successivo e parallelo. Si può essere scrupolosi ma io non controllerei sistematicamente 77000 voci. Di argomenti poco mirati ce ne sono, ma sono una minoranza. Per molti argomenti invece non ce ne saranno proprio, ad es. in certi casi in cui posso sfruttare un template. Sul lungo periodo quelle veramente fuori posto verranno sistemate dai vari interessati. --AlessioMela (msg) 19:31, 4 lug 2013 (CEST)[rispondi]
non ho mai realmente immaginato che doveva essere sistematico, solo penso sia fondamentale informare i progetti subito prima e subito dopo averlo fatto nella loro categoria, sperando che ci diano una scorsa veloce. Non dico che gli utenti debbano mettere le arg (io per cucina lo faro'), ma almeno realizzare quante ne hanno senza fonti. Credo tuttavi che mi sfugga un passaggio tecnico: Tu devi comunque cambiare l'arg da inserire a ogni ciclo del bot, e quindi avere dei naturali tempi di stasi e quindi di parziale assestamento, o semplicemente intendi dargli un ordine di categorie rilevanti e lui le svolgerebbe in ordine alfabetico in cicli progressivi tutte in poco tempo? --Alexmar983 (msg) 19:49, 4 lug 2013 (CEST)[rispondi]
Ho capito :-). Per il bot è come hai ipotizzato: per ogni argomento il bot si ferma, io lo ricalibro un attimo e poi posso farlo ripartire per l'argomento seguente. Alla fine di tutto, le voci che sono rimaste partiranno con l'ultimo assetto che mette l'avviso senza argomento.
A questo punto, vuoi pensare ad una scaletta concordata da seguire, o preferisci che io lanci il bot a piacere e seguire l'andamento sui suoi contributi? --AlessioMela (msg) 21:14, 4 lug 2013 (CEST)[rispondi]
Se ti fidi di me, ti posso segnalare un ordine calibrato in funzione dell'attività dei progetti, in modo da partire da quelli con più utenti attivi per voce. Lo stimerei a fiuto, ma dovrei avere abbastanza "esperienza" da indicarti quelli giusti. Ne possiamo parlare anche in talk privata, se non ci sono altri interventi.--Alexmar983 (msg) 21:18, 4 lug 2013 (CEST)[rispondi]
Sì sono d'accordo, in effetti l'organizzazione del bot è un po' OT. Magari quando crei la conversazione in talk metti un link anche qui per gli altri. --AlessioMela (msg) 21:30, 4 lug 2013 (CEST)[rispondi]
Io comunque non parlavo di controllare l'argomento, ma di controllare, almeno sul primo campione, che le voci bottate siano effettivamente senza fonti... --Bultro (m) 13:07, 5 lug 2013 (CEST)[rispondi]
L'elenco generato da Incola fornisce tutte le voci che non hanno le sezioni standard per le fonti. Può darsi che nel frattempo in qualche voce qualcuno abbia messo le fonti o che qualcuna le avesse fuori standard. Probabile che ci siano, ancora più probabile che siano in minima parte. Si può controllare, ma credo che il gioco non valga la candela. Se in qualche caso il template è davvero diventato superfluo, il primo che lo vede lo toglie. O meglio ancora, alla fine di tutto si fa l'elenco inverso, le voci con il template e che hanno le sezioni per le fonti, poi si controllano solo quelle. --AlessioMela (msg) 13:48, 5 lug 2013 (CEST)[rispondi]

Qui è possibile seguire l'andamento del lavoro del bot. --AlessioMela (msg) 15:12, 6 lug 2013 (CEST)[rispondi]

Ho alcune forti perlessità, che ho espresso qui dopo che ho visto annunciare la possibile aggiunta del template F in molte voci di film. Ricordo inoltre che nelle voci già provviste del template {{S}} andrebbe evitata l'aggiunta indiscriminata del template {{F}} (nella cui pagina difatti è scritto: "Negli abbozzi più brevi, già segnalati con {{S}}, l'incompletezza della voce è già evidenziata, quindi per essi potrebbe essere eccessivo aggiungere anche l'avviso di mancanza fonti"). --Spinoziano (msg) 13:35, 8 ago 2013 (CEST)[rispondi]
P.s. Faccio inoltre presente che, laddove mancano le sezioni note, bibliografia o collegamenti esterni, possono comunque esserci delle fonti citate nel corpo del testo (ad esempio fra parentesi, o con normali collegamenti ipertestuali, come indicato all'inizio di Aiuto:Uso delle fonti). Usare bot per riempire le voci di avvisi non ponderati, oltre che antiestetici e probabilmente inutili, può essere una leggerezza che manca di rispetto a chi ha scritto quelle voci, e mi pare un tipico eccesso che viola l'articolo della wikiquette che invita ad evitare per quanto possibile l'uso di bot (Wikipedia:Raccomandazioni e linee guida#Linee guida generali). --Spinoziano (msg) 13:56, 8 ago 2013 (CEST)[rispondi]
Le voci con S almeno inizialmente erano state escluse, e sono favorevole a continuare su quella linea.
Siamo consapevoli che possono esserci dei falsi positivi, ma si sta facendo il lavoro con prudenza, come vedi da Utente:AlessioMela/Sandbox. Gli errori sono rari ed è meglio un F di troppo che 1000 F in meno. Purtroppo i numeri sono questi: F è ancora molto sottoutilizzato, e questo intervento una tantum serve a sgrossare il problema--Bultro (m) 09:45, 9 ago 2013 (CEST)[rispondi]
Confermo quanto detto da Bultro. Stiamo andando avanti pianissimo, per gestire al meglio le cat di lavoro sporco, per fixare velocemente eventuali errori e falsi positivi (per ora veramente pochissimi).
Tolgo dall'elenco le voci con S. --AlessioMela (msg) 11:14, 9 ago 2013 (CEST)[rispondi]