Utente:Timendum/Randomtest

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Come funziona[modifica | modifica wikitesto]

L'idea è molto semplice, clicco per 10 volte su Una pagina a caso e valuto il risultato, questo dovrebbe dare un'idea di come è messo il nostro progetto. Ho deciso (di mia iniziativa) di dividere, secondo il mio personalissimo giudizio, gli articoli così trovati in categorie, per poi otterene una specie di voto.

Faccio questo test per cercare di valutare lo stato degli articoli del nostro wiki, e, come alle elezioni danno le percentuali di voti tra due numeri, anche io ottengo un intervallo in cui, al 95% c'è il voto medio di tutti gli articoli.

Al terzo test mi sono accorto che la stima è un po' troppo, dovrei prendere un campione molto più ampio e abbasare la certezza per avere dei risultati significativi; l'ideale sarebbe avere un margine di 1, 1.5 al massimo, cioè una varianza (stimata) bassa (e su questo non ci posso fare niente) e una T bassissima, per avere un'idea con 100 test al 90% ho 1.29, quindi rinuncio ai calcoli statistici, li lascio esplicitati per i posteri.

In parole povere, siccome gli articolo sono molto diversi tra loro (tanti ottimi, tanti stub, eccetera) ho bisogno di valutarne molti per avere un'idea di quanto cambino tra loro e di quale sia l'ordine di incertezza (se gli articoli sono molto vari, non posso dire niente).

Statisticamente[modifica | modifica wikitesto]

Stimo la varianza (incognita con) dove sono il numero di prove (10), è l'esito dell'esperimento (il mio voto) e è la media dei voti..

Da qui cerco di stimare la media: Con probabilità la media delle pagine ricade nell'intervallo ; è la T di Student. Ho intenzione di estrarre un campione di 10 elementi e di stimare l'intervallo con una probabilità del 90%.

Come fare i conti[modifica | modifica wikitesto]

Prima è necessario calcolare : si calcola la media, quindi si prendono tutte le (10) votazioni, si fa la somma di tutte le differenze al quadrato e si divide il risultato per il numero delle estrazioni meno 1. Esempio (con solo 4 estrazioni) 5 2 1 0, media=2; varianza =

Quindi arriviamo all'intervallo in pratica è centrato sulla media () a cui bisogna togliere o sottrarre (per bordo positivo o negativo) la T di Student, che vale 1,83311 , moltiplicata per di facile calcolo (n=10).

La Storia[modifica | modifica wikitesto]

Ho visto prima la pagina di Manutius su cui ho letto per la prima volta il test, quindi ho letto l'originale sulla pagina di Ambi, mi è sembrato un buon test e quindi ho iniziato. In seguito ho aggiunto il capitolo su Come fare i conti, su segnalazione di Manutius, in modo che ogninuno possa condurre i propri esperimenti e ho ulteriormente chiarificato l'idea per suggerimento di Clark Shuster.

Categorie[modifica | modifica wikitesto]

Do voti da 5 a 0 a seconda dell'articolo:

  • 5 se è perfetto, completo (a meno di piccoli errori di ortografia)
  • 4 se è completo, ma con troppi link rossi
  • 3 se è un articolo decente
  • 2 se è più di uno stub, ma breve o comunque incompleto
  • 1 se è uno stub
  • 0 se è da cancellare, viola i copyright o simili

I risultati[modifica | modifica wikitesto]

16/06/2005[modifica | modifica wikitesto]

Media: 2,5; Stima Varianza: 2,06; Intervallo: tra 2,88666 e 1,22446 al 90% => Scarso

27/06/2005[modifica | modifica wikitesto]

Media: 2,9; Stima Varianza: 3,511884; Intervallo: tra -3,537670 e 9,33770 al 90% => Campione troppo piccolo vista la varianza.

11/07/2005[modifica | modifica wikitesto]

Media: 3,1; Stima Varianza: 2,666667; Intervallo ancora troppo ampio (margine di 4,88829)