Wikipedia:Bar/Discussioni/Uso del bot nella categorizzazione

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Uso del bot nella categorizzazione


Salve! Il bot attivato per aumentare la connettività delle voci, applica anche il template {{categorizzare}} alle voci che ancora non hanno una categoria. A differenza di Speciale:PagineSenzaCategorie riconosce anche le pagine che hanno solo categorie nascoste di servizio e per questo motivo ha potuto segnalare circa 2000 pagine che nel corso degli anni si erano perse per it.wiki senza categoria. Purtroppo ci sono dei problemi.

  • Il bot lavora su una copia di it.wiki con qualche ora di differenza da quando fa gli edit, per questo motivo vengono segnalati falis positivi. Al secondo passaggio elimina eventuali template errati, ma questo confonde i lavorsporchisti e possibili nuovi utenti.
  • Il bot non può sapere l'argomento della voce, quindi mette un template senza argomento, popolando la categoria delle voci da categorizzare con argomento sconosciuto.

Il secondo problema è risolvibile mettendo manualmente l'argomento al template, mentre riguardo al primo ancora non si può fare nulla, anche se in futuro il bot potrebbe essere "più intelligente". Segnalo qui la cosa per prendere una decisione a riguardo poiché, secondo le prime opinioni (linkate in "problemi" sopra), il lavoro svolto è un aiuto e un ostacolo al tempo stesso. --AlessioMela (msg) 18:10, 30 ott 2012 (CET)[rispondi]


Io non sono un esperto di funzionamento di BOT e di conseguenza non so nulla di cosa si può e non si può fargli fare, evitando di riprendere quanto detto qui trovo comunque il lavoro fatto dal BOT generalmente buono nonostante tutto. Per ora potrei fare due proposte, anche se entrambe hanno alcuni difetti: la prima consisterebbe nel far girare il bot ogni 48h o 72h o più in modo da non riprendere le stesse voci più di una volta; qui non si risolve il problema giustamente segnalato da Jano ma aumentando il runtime almeno non si lavora 2 o 3 volte (comunque il bot poi sistema i suoi errori 24h dopo al successivo passaggio). Una seconda proposta potrebbe essere quella di filtrare le voci con dimensione inferiore a tot Kb e apporre su queste il template {{A}} anzichè {{categorizzare}}, cosa che da un lato mi sembra la più sensata, dall'altro rischia di spostare altrove il sovraffollamento di lavoro.
Ripeto che secondo me dovremmo essere più accondiscendenti con il bot per adesso, che sta ancora facendo i primi giri del database e i malanni che fa sono anche causati dal grande lavoro arretrato che sta facendo. --Torque (msg) 19:41, 30 ott 2012 (CET)[rispondi]
Ricordo che il bot lavora anche sulle isolate e sulle voci senza uscita, fermarlo per le categorie significherebbe fermarlo del tutto. Quindi, almeno finché non si riesce a eliminare questo problema in qualche modo, sarebbe comodo per gli altri progetti farlo lavorare anche solo a regimi bassi/molto bassi, come quelli proposti da Torque. Non c'è bisogno di ripetere quanto scritto nella discussione linkata, ma credo sarebbero utili i pareri a riguardo, di chi aveva intenzione di bloccare del tutto il bot.--AlessioMela (msg) 21:27, 30 ott 2012 (CET)[rispondi]
Ah, finché non troviamo un consenso o una soluzione il bot resterà fermo (lo è già). --AlessioMela (msg) 21:32, 30 ott 2012 (CET)[rispondi]
Visto che è un tipo di lavoro (quello della categorizzazione) che non seguo molto, bisognerebbe capire da chi lo fa sistematicamente se sono più i vantaggi o gli svantaggi. Da quel che so il bot in un unico passaggo appone i 3 avvisi, se necessario: Pagine senza uscita , Pagina isolata e Pagina non categorizzata, quindi chiedergli di ritardare il passaggio ha effetto su tutti e tre. Se effettivamente risultasse un problema, come soluzione di back up, si potrebbe usare un template invisibile creato apposta per il bot, e quindi una avere categoria tipo Categoria:Bot-Categorizzare o qualcosa del genere. Questo permetterebbe di avere sotto controllo comunque queste pagine, senza che venga applicato un template visibile che segnala un problema, che magari è stato risolto, praticamente come sta lavorando attualmente con le pagine senza uscita. Intano segnalo anche al Progetto:Coordinamento/Categorie che potrebbe essere interessato all'argomento. --ValterVB (msg) 21:48, 30 ott 2012 (CET)[rispondi]
Un'altra soluzione, discussa anche con chi ha creato il codice, è quella di far saltare al bot le pagine che sono state editate nelle precedenti 48h (o un tempo a scelta). In questo modo segnala solo le pagine "dimenticate" e non dovrebbe ostacolare il lavoro sporco. Questa modifica sarebbe una delle meno difficili da fare, anche se potrebbe non essere così immediato farla. Ora, a fronte di queste ipotesi, quale pensate possa essere la migliore? --AlessioMela (msg) 23:52, 30 ott 2012 (CET)[rispondi]
Per me la migliore e anche la più facile è disabilitare solo la funzione Categorizzare. Ora che le voci "disperse" da tanto sono state segnalate, può ripassare anche tra un mese...
Inoltre, sapevate che esiste http://toolserver.org/~mauro742/voci_da_categorizzare/ ? --Bultro (m) 23:59, 30 ott 2012 (CET)[rispondi]
E' vero che Speciale:PagineSenzaCategorie non elenca le voci che hanno categorie, nascoste, ma è anche vero che il 90% delle volte queste categorie nascoste sono quelle dei template {{A}} o {{W}} (e se esistono queste non va messo il categorizzare). Inoltre aggiungere forzatamente il {{categorizzare}} fa in modo che, inserendo la voce in una categoria nascosta, questa addirittura scompaia da Speciale:PagineSenzaCategorie. L'esistenza del tool di Mauro che indica Bultro mi fa concludere che sia inutile il lavoro di questo bot sul categorizzare, e che quindi debba essere proprio bloccato il suo inserimento di questo template Jalo 08:38, 31 ott 2012 (CET)[rispondi]
Ho notato che la voce Caccianemici era già categorizzata in Categoria:Famiglie dell'Emilia, ma il bot ha ugualmente inserito il template (che ora ho rimosso). Come mai? -- Yiyi (A tua disposizione!) 08:53, 31 ott 2012 (CET)[rispondi]
Era stata aggiunta 3 ore prima. Il bot lavora su liste di voci vecchie di 1 giorno. Il problema semmai è che il giorno dopo sarebbe dovuto passare a toglierla, e invece sono passati 3 giorni ed era ancora lì :/ Jalo 09:03, 31 ott 2012 (CET)[rispondi]
E' il motivo di questa discussione: Il bot in quel caso ha lavorato sulla copia del database del 2012-10-28 12:06:05 e in quel momento la voce era senza categorie, la categoria è stata applicata alle 14:49, 28 ott 2012, quindi successivamente all'ora della copia del database. Il bot l'averebbe levata ieri o oggi, ma per ora è stato fermato. --ValterVB (msg) 09:07, 31 ott 2012 (CET)[rispondi]
Come Bultro e Jalo, la mia opinione è che la soluzione più semplice sia quella di astenersi solamente dall'aggiunta di Categorizzare. --DelforT (msg) 09:30, 31 ott 2012 (CET)[rispondi]
Io invece preferirei che il BOT continuasse a girare anche per le voci da categorizzare, ma non prima di aver apportato le modifiche sopra proposte, o altre che potrebbero venir aggiunte! Il suo lavoro non è stato inutile, però va fixato --Torque (msg) 12:50, 31 ott 2012 (CET)[rispondi]
Premesso che il tool di Mauro742 ha dei periodi in cui non funziona / non viene aggiornato / segnala pochissime voci e quando recupera le altre lo fa senza mantenere la data in cui si sono trovate originariamente incluse nell'elenco, ed inoltre appare meno comodo rispetto ad una categoria apposita perché delle voci che contiene non si possono visualizzare popup per dare un'occhiata rapida ad incipit o cronologia ecc., sull'utilità dell'inserimento tramite bot del semplice {{Categorizzare}} faccio notare che, nel caso (molto frequente) di voci in cui andrebbe apposto un template autocategorizzante, il tutto rischia di comportare lavoro inutile (se non addirittura dannoso) all'utente poco esperto che non sa che non occorre categorizzare manulamente biografie, album, film ecc. Sanremofilo (msg) 15:21, 31 ott 2012 (CET)[rispondi]
Esatto, è il problema principale per cui è stato più volte avvisato il manovratore del bot. --DelforT (msg) 15:23, 31 ott 2012 (CET)[rispondi]

(Rientro) Assodato che l'aggiunta del template categorizzare crea più confusione che altro, potremmo seguire l'idea proposta in cima da Valter, che propone di creare una categoria di appoggio con template invisibile. In questo modo resta comunque fruibile il lavoro del bot. Autoaggiornerà i template invisibili correggendo ogni volta eventuali lag del giorno precedente, ma fornirà un elenco comodo di tutte quelle voci che non hanno categorie. Così i meno esperti non si allarmeranno vedendo l'avviso e potranno approfondire leggendo le specifiche in una determinata pagina. Un altro vantaggio è che questa soluzione si può attuare molto velocemente così il bot può riprendere il lavoro nelle altre sezioni. Non credo si possa altrettanto velocemente far smettere al bot di considerare la questione categorie, visto che lavora su più wiki e le altre lo usano anche per quello. Che ne dite? --AlessioMela (msg) 17:42, 31 ott 2012 (CET)[rispondi]

Favorevole La vedo come la proposta che congiunge al meglio l'esigenza di tutti --Torque (msg) 18:03, 31 ott 2012 (CET)[rispondi]
Per vedere l'effetto che fa, ho creato il template non visibile: Template:CategorizzareDaBot e la categoria Categoria:CategorizzareDaBot, poi ho sostituito su alcune pagine il template Template:Categorizzare con Template:CategorizzareDaBot. Domani sposto le altre voci, nel frattempo ho eliminato il template dalle voci che avevano una categoria. --ValterVB (msg) 00:19, 1 nov 2012 (CET)[rispondi]
Che dite proviamo a rilanciare il bot con il nuovo template e la nuova categoria? Non dovrebbe più interferire con Categoria:Categorizzare. Nel frattempo ho anche provveduto a sostituire il template originale con quello nuovo in tutte le voci che avevano già il template W o il template A. --ValterVB (msg) 14:39, 1 nov 2012 (CET)[rispondi]
Proviamo! La nuova categoria dove la possiamo inserire all'interno della pagina Categoria:Categorizzare? --Torque (msg) 13:50, 2 nov 2012 (CET)[rispondi]
Ho chiesto di riattivare il bot, utilizzando il nuovo template. A spanne dovrebbe ripartire domani pomeriggio. --ValterVB (msg) 19:39, 2 nov 2012 (CET)[rispondi]