Wikipedia:Bar/Discussioni/Grafico statistiche di crescita it wikipedia

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Grafico statistiche di crescita it wikipedia NAVIGAZIONE



crescita di it wikipedia

Prendendo spunto dalle statistiche presenti qui ho provato a creare un grafico riassuntivo della crescita di it wikipedia usando alcuni indicatori a mia scelta, fra quelli disponibili e che mi sembrano/sembravano più indicati per avere una indicazione sui trend evolutivi dell’enciclopedia.

Li commento, assieme ad una nota esplicativa per la comprensione del grafico.

  1. Linea continua nera: numero delle voci dell’enciclopedia: in costante e regolare aumento dal 2007.
  2. linea rosa; numero di articoli nuovi al giorno, computato ogni crescita di 50000 nuove voci. Dal 2007 la “produzione giornaliera” oscilla fra 500 e 400 nuove voci al giorno. Decisamente fine 2006 - inizio 2007 costituiscono un punto di riferimento nella crescita. (L' altro punto in precedenza fu maggio 2005).
  3. Linea verde: numero di voci con dimensioni maggiori di 2 Kb. Questo numero continua a crescere, (vedi anche suo trend linea nera tratteggiata) confermando che oltre alla attività di creazione di nuove voci, ve ne e’ una parallela di consolidamento e ampliamento di voci preesistenti, smentendo le affermazioni secondo cui l’ enciclopedia cresce sopratutto con stub.
  4. Linee marrone (numero di link interni) e azzurra (numero di parole nel database) crescono a parallelamente alla crescita delle voci.
  5. linea grigia: link ad immagini, sembrerebbe che le immagini linkate abbiano avuto inizialmente una crescita piu’ lenta, ora invece in linea con gli altri indicatori.

Notare che per esigenza di lettura del grafico, ed essendo più interessato ai trend, che ai valori in assoluto, ho scalato le linee descritte nei punti 3,4 e 5 in modo che combaciassero nel punto iniziale e finale del loro sviluppo. (Per queste curve non ho trovato dati piu' recenti di febbraio 08) --Bramfab Discorriamo 17:59, 9 giu 2008 (CEST)[rispondi]

Mi sembra anche di poter affermare che l’ influenza dell’introduzione dei comuni francesi col Bot ormai non abbia piu’ influenza statistica sullo stato attuale, e i successivi inserimenti coi BOT non sono rilevabili singolarmente, indicando che l’ enciclopedia cresce sopratutto percentualmente col lavoro amanuense di tutta la comunità. --Bramfab Discorriamo 17:39, 9 giu 2008 (CEST)[rispondi]

Tanto di cappello. Complimenti per l'analisi :-) --Retaggio (msg) 17:49, 9 giu 2008 (CEST)[rispondi]
In realtà, a vedere la fonte che ha dato Bramfab, sembra che a febbraio si fermino proprio i dati… Complimenti per l'analisi anche da me! SimoneMLK I have a wiki... 17:56, 9 giu 2008 (CEST)[rispondi]
  • Molto ben fatto, complimenti. Ho solo una preoccupazione: la crescita delle voci > 2K sembra avere trend lineare (una pattuglia di buoni autori che lavora in modo stabile) mentre il numero delle voci sta aumentando con pendenza crescente. Non staremo attirando folle di cattivi autori? --NAleGato (talkback) 22:13, 9 giu 2008 (CEST)[rispondi]
    La didascalia delle voci > 2K riporta "Log", che forse sta per "logaritmo": in tal caso la crescita sarebbe nuovamente esponenziale. --Panairjdde = p.a.d.r. - m.o.i. = 01:08, 10 giu 2008 (CEST)[rispondi]
    (fuori crono) L' equazione della linea tratteggiata nera e' y = 10703Ln(x) - 112566 (se si ricerca un trend logaritmico) o y = 0.2797x - 10326 (se ricercato un trend lineare), coi numeri che abbiamo sostanzialmente cambia molto poco --Bramfab Discorriamo 10:51, 10 giu 2008 (CEST)[rispondi]

Ho aggiunto grafico e commento dell'autore alla pagina Wikipedia:Stampa. --MarcoK (msg) 23:00, 9 giu 2008 (CEST)[rispondi]

Ahem... posso sapere come fa il "numero delle voci" ad essere inferiore al "numero di voci con dimensioni maggiori di 2 Kb"? ;-D Probabilmente c'è qualche problema nella definizione, o io non la capisco. :-) -- Scriban (msg) 10:48, 10 giu 2008 (CEST)[rispondi]

La scala riportata a sinistra vale per il numero totale delle voci (linea blu), quella a destra per il numero di articoli/giorno. La linea verde e' la percentuale di voci maggiori di 2 Kb (a gennaio 08 era del 32%) (mi scuso per non essere stato chiaro, purtroppo nel fare e commentare un grafico statistico piu' complesso di una sola linea, sembra impossibile non accorgersi che vi sia qualcosa che ti sembra chiaro e viceversa non lo e' affatto). --Bramfab Discorriamo 11:03, 10 giu 2008 (CEST)[rispondi]
Scusa se pignoleggio e spacco un po' le palle... ma se è una percentuale ci vorrebbe un asse con delle percentuali! Non si può mettere dei numeri con range 0-100 su un grafico che ha assi 0-n! Inoltre la definizione che hai dato al punto 3 "Linea verde: numero di voci con dimensioni maggiori di 2 Kb" va rivista... Argh!!!! :-) -- Scriban (msg) 15:02, 10 giu 2008 (CEST)[rispondi]
Spacca pure. Il software mi concede solo l' uso di due scale Y (una l' usata per il numero delle voci e l' altra per il numero dato dal rapporto articoli/giorno). Delle altre curve quello che mi interessa e' vedere la forma dell'andamento delle curve. Per cui ho riscalato i valori di ogni serie di dati in modo che usando una delle due scale disponibili, le curve fossero disegnate più dettagliatamente possibile e facilmente confrontabili (mi aspetto che che prima o poi dovra' delinearsi una forma ad esse nella curva del numero di voci e cui dovrebbe seguire, ma in ritardo quella degli altri parametri che ho graficato). Come al solito avendo alcune serie di valori se ne possono ricavare decine di grafici diversi. Se siete molto interessati fatevi sotto anche voi, la pagina con le tabelle di partenza e' qui. --Bramfab Discorriamo 16:23, 10 giu 2008 (CEST)[rispondi]
Oh, spero che tu non ti sia offeso, eh! :-) Cmq imho rimane concettualmente sbagliato usare la stessa grafica per cose che sono in un caso valori assoluti e nell'altro percentuali: guardando il grafico sembra che la parte (linea verde) sia maggiore del totale (linea nera)... Insomma le voci >2k oggi che percentuale sono sul totale? io da lì non lo capisco. Ciao. :-) -- Scriban (msg) 16:56, 10 giu 2008 (CEST)[rispondi]
Ci vuol ben altro per essere offesi. Se un grafico e' fatto per essere usato in modo qualitativo, ci metti quello che ritieni piu' adeguato. (Pensa ai grafici misti tipo linee e barre). Tra l' altro questo e' un grafico in progress, in quanto ad ogni tot di mesi i suoi limiti superiori saranno cambiati. --Bramfab Discorriamo 17:10, 10 giu 2008 (CEST)[rispondi]
Appunto! linee E barre esprimono meglio che le tipologie di dati sono diverse! Era quello che intendevo... ;-) -- Scriban (msg) 09:14, 11 giu 2008 (CEST)[rispondi]

Altri progetti[modifica wikitesto]

Ci sono dati statistici anche sugli altri progetti? Si possono realizzare grafici con i dati aggregati?--Mizar (ζ Ursae Maioris) (msg) 08:01, 12 giu 2008 (CEST).[rispondi]

I dati ci sono in abbondanza. Quello che che serve e' il tempo libero....--Bramfab Discorriamo 09:53, 12 giu 2008 (CEST)[rispondi]