Wikipedia:Bar/Discussioni/Tool statistiche avvisi di servizio

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Tool statistiche avvisi di servizio


Ciao! Vi voglio segnalare un nuovo tool che abbiamo realizzato Incola ed io: maintgraph.

Abbiamo iniziato a raccogliere qualche statistica sugli avvisi di servizio delle voci di Wikipedia in italiano, così da poter analizzare sul lungo periodo le problematiche relative al lavoro sporco e affini. Il progetto maintgraph ha lo scopo di mostrare graficamente questi numeri per aiutarci a capire le varie dinamiche. Attualmente è presente una sola pagina oltre alla home, con un grafico sul numero di avvisi complessivi di itwiki, ma in futuro ne seguiranno altre.

Buon divertimento! --AlessioMela (msg)

+1 Grazie. Non ho altre parole! :) --Daniele Pugliesi (msg) 04:03, 31 mag 2014 (CEST)[rispondi]
Ottimo lavoro, complimenti. -- Mess (is here... since 2006!) 10:48, 31 mag 2014 (CEST)[rispondi]
+1; si sanno gia i tempi per portare a regime il tool con il numero di pagine sufficiente per un utilità non marginale?--95.252.86.196 (msg) 10:53, 31 mag 2014 (CEST)[rispondi]
Grazie a tutti per gli apprezzamenti!
@ip: Cosa intendi con "numero di pagine sufficiente"? Fai conto che ogni giorno si aggiunge il dato delle ultime 24 ore, per cui se ad esempio vuoi vedere i dati di un anno...occorre aspettare un anno :-) Prima del 6 maggio purtroppo nessuno raccoglieva quotidianamente quei dati in maniera precisa. --AlessioMela (msg) 12:39, 31 mag 2014 (CEST)[rispondi]
ti cito @AlessioMela Attualmente è presente una sola pagina oltre alla home, con un grafico sul numero di avvisi complessivi di itwiki, ma in futuro ne seguiranno altre; ora ti è più chiara la domanda?--95.252.86.196 (msg) 13:44, 31 mag 2014 (CEST)[rispondi]
Con quella frase volevo dire che in futuro seguiranno altri grafici o schemi. Tuttavia non ti so dire di preciso quando riusciremo a pubblicarli perché tutto dipende dal nostro tempo libero e nel mese venturo sarà piuttosto scarso causa esami. --AlessioMela (msg) 14:00, 31 mag 2014 (CEST)[rispondi]
@AlessioMela Se ho capito bene, nelle prossime pagine che verranno create saranno indicati gli andamenti relativi alle singole categorie di lavoro sporco (ad esempio: stub, voci senza fonti, voci da controllare, ecc.). Confermi?
C'è anche in programma la possibilità di filtrare tali dati in base al progetto di competenza? --Daniele Pugliesi (msg) 15:48, 31 mag 2014 (CEST)[rispondi]
p.s.: Riguardo al primo punto, ho letto adesso le istruzione e in effetti questa possibilità c'è già. Magnifico! :) --Daniele Pugliesi (msg) 15:53, 31 mag 2014 (CEST)[rispondi]
+1 Grazie! --Adalingio 15:54, 31 mag 2014 (CEST)[rispondi]
  1. Noto che selezionando più categorie insieme si vede una certa costanza del numero di voci in ciascuna categoria. Ad esempio, selezionando tutte le categorie che contengono meno di 1000 voci, si vede che le uniche variazioni importanti durante queste 2 settimane sono state una netta diminuzione delle voci senza uscita e un aumento delle voci da categorizzare. Penso comunque che sarebbe utile oltre a tale grafico che mostra i valori "in assoluto" tracciare un altro grafico che mostri come i dati variano: in pratica bisogna fare la derivata (o meglio il rapporto incrementale) del grafico: in questa maniera i grafici delle singole categorie possono essere confrontati meglio (in particolare si può vedere quali categorie stanno avendo una diminuzione o un aumento di voci più o meno rapidi).
  2. Inoltre sarebbe utile inserire in corrispondenza della legenda a destra i link a ciascuna categoria.
  3. Ultimo suggerimento: mi piacerebbe se si potessero ordinare le categorie sia in ordine alfabetico, sia in ordine di voci contenute sia in ordine di variazione percentuale. --Daniele Pugliesi (msg) 16:07, 31 mag 2014 (CEST)[rispondi]
  1. Questo è proprio il work in progress attuale. Per farlo stiamo raccogliendo ogni giorno il numero di avvisi aggiunti e tolti di ogni categoria. In questo modo si potrà vedere bene la differenza. Facendo ad esempio con la derivata potremmo avere delle false percezioni, ad esempio nel caso in cui il numero di avvisi tolti e aggiunti di un certo giorno è lo stesso. Tuttavia stiamo ancora ragionando su come graficare i dati.
  2. Potrei rendere cliccabili le parole della legenda, che ne dici?
  3. Intendi una specie di tabella, con quei dati ordinabili, secondo un certo intervallo di tempo selezionabile?
Grazie dei suggerimenti ;-) --AlessioMela (msg) 17:09, 31 mag 2014 (CEST)[rispondi]
  1. Difatti la variazione si osserva tra un giorno e il successivo, quindi è normale che sia la somma algebrica degli aumenti e delle diminuzioni, ma lo stesso discorso vale per il numero assoluto di avvisi, che non tiene conto appunto del fatto che alcuni avvisi siano stati tolti e altri aggiunti. Comunque nello stesso modo in cui il grafico del numero assoluto di avvisi si mantiene pressoché costante, il grafico relativo alla sua derivata dovrebbe evidenziare un andamento piuttosto regolare, senza troppe discontinuità, evidenziando così il reale tasso di crescita o diminuzione netta degli avvisi. Il vantaggio di questo tipo di grafico è quello di potere vedere a colpo d'occhio in quale categoria ci si sta impegnando di più o di meno. Quando gli utenti lavorano molto su queste categorie si nota che i grafici sono meno "lisci", più spezzettati, mentre quando gli utenti fanno solo un tipo di azione (aggiungere template di avviso o migliorare le voci) l'andamento è più "liscio", senza spigoli, mentre infine quando non ci sono molte azioni la categoria mantiene un valore pressoché costante, senza aumentare o diminuire in nessun giorno. Un altro modo dunque di vedere se in una categoria c'è poco o molto lavoro potrebbe essere quello di calcolare la somma dei valori assoluti delle variazioni giornaliere: le categorie dove si lavora di più (sia aggiungendo sia togliendo template di avviso o entrambi) hanno questo valore più elevato. Da notare che ho usato il termine "numero assoluto" in contrapposizione a "numero relativo", mentre "valore assoluto" è la funzione matematica che si indica tra sbarrette tale che ad esempio |1| = |-1| = 1. Risultato analogo si può ottenere facendo la radice della somma dei quadrati, o se volete si può fare semplicemente la somma dei quadrati. Un'altra maniera ancora per potere vedere come varia il numero degli elementi nelle categorie senza ricorrere alla derivata potrebbe essere quello di normalizzare i dati in modo tale che per ciascuna categoria i grafici assumano valori tra 0 (valore minimo) e 1 (valore massimo): ciò permetterebbe di confrontare in maniera chiara gli andamenti in più categorie.
  2. Sì, è un'ottima idea.
  3. Così come è organizzata adesso la legenda va bene, ci vorrebbero solo dei tastini in cima con scritto "Ordine alfabetico", "Ordina per numero di avvisi", "Ordina per variazione giornaliera"; cliccando uno di tali tastini dovrebbero cambiare l'ordine in cui appaiono gli elementi della legenda. --Daniele Pugliesi (msg) 18:31, 31 mag 2014 (CEST)[rispondi]
1. (fuori crono) Il grafico per il numero assoluto di avvisi, quello attuale, ci permette di capire in modo grezzo quanto lavoro c'è da fare in una certa categoria nel tempo. Però anche noi avevamo riscontrato che serviva un secondo sistema che permettesse di vedere bene se in una categoria si lavora o meno. La nostra idea penso ricalchi la tua seconda ipotesi. Tuttavia penso sia fattibile anche aggiungere al grafico attuale un pulsantino per passare alla visualizzazione in derivata, lo metto in todo list!
3. Uhm, ok! Spero solo di capire dove mettere graficamente le linguette :P --AlessioMela (msg) 11:51, 1 giu 2014 (CEST)[rispondi]

[ Rientro] Ottimo, bravissimi! --Horcrux九十二 23:13, 31 mag 2014 (CEST)[rispondi]

Ottimo lavoro davvero. Ascolta, da dove prendete i dati (per capire il metodo e l'aggiornamento? immagino sia una cache..), potreste scriverlo nel tool. Molto interessante comunque!! Utile pure per tesi e studi :-) --Lucas 01:57, 1 giu 2014 (CEST)[rispondi]
Altro suggerimento: siccome il tool ha riscosso molti pareri entusiasti, direi che si può iniziare a linkarlo in tutte le pagine che parlano di lavoro sporco, in modo tale che gli utenti abbiano sempre sott'occhio questi dati sul lavoro sporco e magari si impegnino di più a fare in modo che il numero di pagine in ciascuna di queste categorie inizi a calare piuttosto che continuare l'impennata verso l'alto (in particolare le voci stub e quelle senza fonti, che non ne vogliono sapere proprio di diminuire, neanche momentaneamente). --Daniele Pugliesi (msg) 02:48, 1 giu 2014 (CEST)[rispondi]
Grazie! I dati sono estratti dalla copia del database di Wikipedia disponibile presso il Labs, alle ore 21 di ogni giorno (se il Labs funziona :P). Alle ore 22 il mio bot provvedere ad aggiornare con questi dati le statistiche del lavoro sporco visibili nel Wikipediano e nel Portale Comunità. A breve aggiungeremo queste informazioni nelle pagine del tool e col tempo vedremo di implementare gli altri suggerimenti. Se volete linkare in altre pagine fate pure, gli indirizzi rimarranno quelli. --Incola (posta) 09:32, 1 giu 2014 (CEST)[rispondi]
Io faccio fatica a capire le istruzioni: Vedo che qui si dice (correggendosi) che indicano come "filtrare per progetto", ma io non lo vedo. Inoltre nelle istruzioni c'è scritto "Per guardare nel dettaglio un periodo temporale preciso utilizzare la barra sottostante l'asse delle ordinate." ma sotto l'asse delle ordinate non lo vedo (ah ... forse sotto quello delle ascisse? In giallino su bianco non l'avevo notata molto). --109.54.25.127 (msg) 16:29, 1 giu 2014 (CEST)[rispondi]
Il filtro per progetto è una proposta non ancora implementata. Anch'io ho trovato difficoltà a capire questo strumento, perché non avevo fatto inizialmente caso alle istruzioni, per cui secondo me sarebbe meglio metterlo in alto alla pagina anziché in basso e magari scrivere qualche parola in più. --Daniele Pugliesi (msg) 18:58, 1 giu 2014 (CEST)[rispondi]
Ottimo tool, anche a me interesserebbe una suddivisione per progetto, ma senza alcuna fretta. --Epìdosis 10:02, 2 giu 2014 (CEST)[rispondi]
(fuori crono) @109: Sì è come dici, è sotto l'asse delle ascisse. A breve miglioreremo la documentazione e magari lo rendo più visibile.
@Epìdosis: la suddivisione per progetto sarebbe ancora più interessante, tuttavia penso che nel breve sia un po' difficile da realizzare. Attualmente gli avvisi di servizio hanno suddivisioni per argomento poco simmetriche e questo rende complicato automatizzare i grafici per progetto. Come avrai notato il tool si appoggia alla struttura di avvisi di Wikipedia (senza modificarla), pertanto se essa verrà perfezionata potremmo fare anche questo, mentre allo stato attuale andrebbero settati i progetti uno per uno. --AlessioMela (msg) 17:23, 3 giu 2014 (CEST)[rispondi]
Suggerimento: confrontare il lavoro sporco su più progetti attraverso i collegamenti interlinguistici (Wikidata) tra categorie. --Ricordisamoa 10:16, 2 giu 2014 (CEST)[rispondi]
Se si dovessero inserire anche le categorie di lavoro sporco nelle altre lingue, si dovrebbe inserire almeno una traduzione in inglese, in modo da dare la possibilità anche alle altre wiki di usufruire di questo tool. --Daniele Pugliesi (msg) 16:04, 2 giu 2014 (CEST)[rispondi]
Ottimo strumento, molto interessante, complimenti :-) --Retaggio (msg) 11:22, 3 giu 2014 (CEST)[rispondi]
@Ricordisamoa: Sì potrebbe essere molto interessante. Lo lasciamo però come task lontano perché le varie wiki hanno sistemi di avvisi di servizio simili ma non proprio simmetrici.
@Daniele Pugliesi: Abbiamo pensato di pubblicare il tool inizialmente solo in italiano poiché è dedicato esclusivamente a questa edizione linguistica, ma se diventa "internazionale" sicuramente adotteremo almeno l'inglese.
Grazie ancora tutti per i consigli! --AlessioMela (msg) 17:17, 3 giu 2014 (CEST)[rispondi]

[ Rientro] Alessio ed io abbiamo implementato la possibilità di visualizzare il numero di voci a cui sono stati aggiunti o rimossi i vari avvisi di servizio, nonché la derivata numerica calcolata come la differenza tra questi due valori. Inoltre abbiamo sistemato il layout del grafico per renderlo adattabile alla risoluzione di chi lo visualizza. --Incola (posta) 23:12, 14 giu 2014 (CEST)[rispondi]

Superbo! Ho provato a vedere tutte le variazioni delle categorie in un unico grafico: adesso è evidente che il numero di stub e voci senza fonti è in continua crescita, mentre il lavoro sporco dove ci concentriamo di più è l'aggiunta dei template sinottici. Per le altre categorie invece il numero di aggiunte è dello stesso ordine di grandezza del numero di rimozioni. Morale della favola: se continuiamo con questo trend, il numero di stub e di voci senza fonti (o meglio le voci in cui sono presenti i relativi avvisi) aumenteranno all'infinito, mentre il numero delle altre "voci sporche" subirà lievi variazioni.
Nuova proposta: propongo di aggiungere tre pulsanti:
  • uno per selezionare tutte le categorie ("Seleziona tutte")
  • un altro per deselezionare tutte le categorie ("Deseleziona tutte")
  • uno per selezionare quelle deselezionate e viceversa ("Selezione inversa").
--Daniele Pugliesi (msg) 23:42, 14 giu 2014 (CEST)[rispondi]
[@ Daniele Pugliesi] In cantiere abbiamo l'introduzione di altre due nuove pagine, una sul numero di edit per namespace e l'altra sul numero di edit per tipo. Ovviamente avremo bisogno del tuo puntuale feedback :-) Alla lista abbiamo aggiunto anche i bottoni che hai proposto qui sopra. Grazie ancora! --AlessioMela (msg) 12:08, 15 giu 2014 (CEST)[rispondi]

[@ AlessioMela, Incola] avete 2 patch da revisionare ;-) --Ricordisamoa 00:38, 17 lug 2014 (CEST)[rispondi]

Aggiornamento estivo

[modifica wikitesto]

AlessioMela ed io abbiamo introdotto nuove funzionalità in maintgraph. È ora possibile vedere il grafico del numero di edit effettuati su itwiki, il numero di voci divise per fascia di dimensione (probabilmente verrà migliorata la sua leggibilità in seguito), il numero di pagine divise per namespace ed altri grafici vari. Ora è anche possibile linkare direttamente un particolare grafico: ad esempio il numero di discussioni utente è cresciuto più rapidamente per l'introduzione dell'app per il telefono oppure il numero di voci è diminuto per la questione del tennis. Il numero di voci è diverso dal conteggio ufficiale visualizzato in home perché esso non è mai completamente aggiornato al valore attuale. Se avete suggerimenti scriveteci pure. --Incola (posta) 10:20, 12 ago 2014 (CEST)[rispondi]

Complimentoni. Suggerimenti: 1) possibilità di scegliere fra scala automatica degli assi o impostazione personale dell'utente, variabile a piacere, 2) possibilità di avere la scala verticale logaritmica.--Bramfab Discorriamo 12:26, 12 ago 2014 (CEST)[rispondi]
Grazie! Puoi specificare meglio il punto 1? Già, la scala verticale logaritmica in certi casi può essere molto interessante. Era tra le cose da fare, ma avevamo avuto qualche difficoltà tecnica. Magari guardiamo meglio. --AlessioMela (msg) 13:58, 12 ago 2014 (CEST)[rispondi]
Semplicemente magnifico!
Suggerimento: Per aumentare ulteriormente la leggibilità del grafico, penso che sarebbe utile se quando si passa il mouse su una curva del grafico venisse indicato un puntino sulla curva e un rettangolino vicino a quel puntino i valori delle ascisse e delle ordinate che sono assunti in quel punto e il nome della curva associata a quel puntino. Ciò permetterebbe di soffermare l'attenzione sul singolo punto, mentre al momento l'attenzione è rivolta ad una "linea" corrispondente ad un certo periodo temporale; quindi la mia idea è di integrare (non sostituire) tale funzionalità. In alternativa al "puntino", si potrebbe far sì che quando si passa vicino ad una curva, il nome della curva nella didascalia a destra sia evidenziato: ciò adesso è possibile solo se si clicca sulla curva, ma quando le curve sono molto ravvicinate non è molto agevole cliccarci sopra.
Altro suggerimento: la definizione nella sezione DRDI mi sembra scritta in maniera poco chiara. Forse scrivere la formula direttamente può agevolare la comprensione. --Daniele Pugliesi (msg) 16:45, 12 ago 2014 (CEST)[rispondi]
Davvero un ottimo lavoro. Come suggerimenti direi: possibilità di cambiare la scala (zoomando magari e potendo "vedere lo zero" sempre) e sostituire "voci" con "edit" etc quando necessario. --Vito (msg) 16:59, 12 ago 2014 (CEST)[rispondi]
sapete già quali funzioni aggiungere nei prossimi mesi?--217.203.110.0 (msg) 17:35, 12 ago 2014 (CEST)[rispondi]
Puoi specificare meglio il punto 1? Ovvero poter indicare o modificare il valore di inizio e di fine (alto - basso) del grafico. --Bramfab Discorriamo 17:42, 12 ago 2014 (CEST)[rispondi]
@Tutti: grazie per gli elogi e l'aiuto per migliorare il tool!
@Daniele Pugliesi: il "puntino" l'ho aggiunto nella todolist ;-) in generale cercheremo di migliorare l'aspetto di cui parli, cercando il compromesso migliore. Il DRDI è volutamente sintetico, essendo solo la pagina in cui vedere l'andamento numerico. Tuttavia abbiamo pensato di scrivere comunque due righe affinché non fosse troppo "mistico" lasciando alla pagina del ns Wikipedia le specifiche del caso. Dici che basta aggiungere soltanto la formula lì sotto?
@Vito: con "cambiare la scala" intendi zoomare l'asse y (tipo come dice Bramfab)? "Vedere sempre lo zero" non credi mostri solo risultati poco significativi (linee quasi completamente parallele all'asse x)? E purtroppo l'ultima parte non ho capito. In pratica non ho capito niente :-(
@217.203.110.0: oltre ai suggerimenti che vengono fuori qui, in todolist c'è: l'aggiunta di tasti play/pausa per vedere scorrere i grafici in (semi)automatico, nuovi tipi di grafico (ora solo solo voci/tempo) come ad esempio quelli a torta e la possibilità di mostrare dei calcoli interessanti sui dati raccolti (es. la percentuale di stub sulle voci totali per dirne uno veloce).
@Bramfab: capito ;-) aggiunto in lista. --AlessioMela (msg) 18:58, 12 ago 2014 (CEST)[rispondi]
Ho chiesto di inserire una formula perché personalmente riuscirei a capire meglio vedendo scritta la formula, non so però se per gli altri utenti è lo stesso. Vediamo cosa ne pensano gli altri...
Concordo con te riguardo a mostrare lo zero: vedremmo tutte linee parallele.
State facendo un ottimo lavoro! Direi di tradurre questo strumento e mostrarlo a quelli di en.wikipedia: secondo me anche loro vorrebbero adottarlo! --Daniele Pugliesi (msg) 03:58, 13 ago 2014 (CEST)[rispondi]
Per ospiatare nuove lingue dobbiamo modificare un minimo la struttura del tool, ma niente di critico. Una volta che lo abbiamo predisposto per più lingue e tradotto in inglese, ci aiuteresti come tramite? Ci vorrà comunque del tempo, ti facciamo sapere quando è pronta questa funzionalità. --AlessioMela (msg) 10:26, 14 ago 2014 (CEST)[rispondi]