Utente:Timendum/Randomtest

Come funziona[modifica | modifica wikitesto]

L'idea è molto semplice, clicco per 10 volte su Una pagina a caso e valuto il risultato, questo dovrebbe dare un'idea di come è messo il nostro progetto. Ho deciso (di mia iniziativa) di dividere, secondo il mio personalissimo giudizio, gli articoli così trovati in categorie, per poi otterene una specie di voto.

Faccio questo test per cercare di valutare lo stato degli articoli del nostro wiki, e, come alle elezioni danno le percentuali di voti tra due numeri, anche io ottengo un intervallo in cui, al 95% c'è il voto medio di tutti gli articoli.

Al terzo test mi sono accorto che la stima è un po' troppo, dovrei prendere un campione molto più ampio e abbasare la certezza per avere dei risultati significativi; l'ideale sarebbe avere un margine di 1, 1.5 al massimo, cioè una varianza (stimata) bassa (e su questo non ci posso fare niente) e una T bassissima, per avere un'idea con 100 test al 90% ho 1.29, quindi rinuncio ai calcoli statistici, li lascio esplicitati per i posteri.

In parole povere, siccome gli articolo sono molto diversi tra loro (tanti ottimi, tanti stub, eccetera) ho bisogno di valutarne molti per avere un'idea di quanto cambino tra loro e di quale sia l'ordine di incertezza (se gli articoli sono molto vari, non posso dire niente).

Statisticamente[modifica | modifica wikitesto]

Stimo la varianza (incognita con) $S_{n}^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}$ dove $n$ sono il numero di prove (10), $X_{i}$ è l'esito dell'esperimento (il mio voto) e ${\overline {X}}_{n}$ è la media dei voti..

Da qui cerco di stimare la media: $\mu ={\overline {X}}_{n}\pm t_{\frac {(1+\alpha )}{2}}(n-1){\sqrt {\frac {S_{n}^{2}}{n}}}$ Con probabilità $\alpha$ la media delle pagine ricade nell'intervallo $\mu$ ; $t$ è la T di Student. Ho intenzione di estrarre un campione di 10 elementi e di stimare l'intervallo con una probabilità del 90%.

Come fare i conti[modifica | modifica wikitesto]

Prima è necessario calcolare $S_{n}^{2}$ : si calcola la media, quindi si prendono tutte le (10) votazioni, si fa la somma di tutte le differenze al quadrato e si divide il risultato per il numero delle estrazioni meno 1. Esempio (con solo 4 estrazioni) 5 2 1 0, media=2; varianza = ${\frac {(5-2)^{2}+(2-2)^{2}+(1-2)^{2}+(0-2)^{2}}{4-1}}=4,{\overline {6}}.$

Quindi arriviamo all'intervallo in pratica è centrato sulla media ( ${\overline {X}}_{n}$ ) a cui bisogna togliere o sottrarre (per bordo positivo o negativo) la T di Student, che vale 1,83311 , moltiplicata per ${\sqrt {\frac {S_{n}^{2}}{n}}}$ di facile calcolo (n=10).

La Storia[modifica | modifica wikitesto]

Ho visto prima la pagina di Manutius su cui ho letto per la prima volta il test, quindi ho letto l'originale sulla pagina di Ambi, mi è sembrato un buon test e quindi ho iniziato. In seguito ho aggiunto il capitolo su Come fare i conti, su segnalazione di Manutius, in modo che ogninuno possa condurre i propri esperimenti e ho ulteriormente chiarificato l'idea per suggerimento di Clark Shuster.

Categorie[modifica | modifica wikitesto]

Do voti da 5 a 0 a seconda dell'articolo:

5 se è perfetto, completo (a meno di piccoli errori di ortografia)
4 se è completo, ma con troppi link rossi
3 se è un articolo decente
2 se è più di uno stub, ma breve o comunque incompleto
1 se è uno stub
0 se è da cancellare, viola i copyright o simili

I risultati[modifica | modifica wikitesto]

16/06/2005[modifica | modifica wikitesto]

Nuovo Regno dell'Egitto: 4 (in realtà scarso)
Orsini (famiglia): 1
Rete satellitare: 2
Stati membri della Confederazione tedesca: 4 (un'elenco di link rossi)
Free Software Directory: 2 (troppo scarno)
Étretat: 1
Bosra: 3
Rete sociale: 5 (non male, dovrei conoscere l'argomento)
Thomas Hobbes: 2 (segnalato come stub, merita di più)
Maienfeld: 1
Nota: saltato Amadeus, disambigua

Media: 2,5; Stima Varianza: 2,06; Intervallo: tra 2,88666 e 1,22446 al 90% => Scarso

27/06/2005[modifica | modifica wikitesto]

Protoattinio: 5 (mi sembra un ottimo articolo)
Governo di Vichy: 1 (stub)
Enzima: 4 (quasi 5)
Metabolismo basale: 3 (lascia alcuni punti aperti)
Giga: 5 (un po' rubato, visto l'argomento troppo ristretto)
Nulla nimium credite: 1
Cavalleria: 4
Trasporto pubblico: 4
Castiglia-La Mancia: 1
Concordia sulla Secchia: 1

Nota: saltati 1729, Gran Premio di San Remo, 491 a.C.

Media: 2,9; Stima Varianza: 3,511884; Intervallo: tra -3,537670 e 9,33770 al 90% => Campione troppo piccolo vista la varianza.

11/07/2005[modifica | modifica wikitesto]

FAT: 3 (incompleta)
Swinging London: 5 (l'argomento mi sembra sviscerato)
Maretto: 1 (stub)
SuperDrive: 5 (come Swinging London)
Thierry Boutsen: 1 (stub)
Ravenna: 5 (molto buono, con foto e storia)
Inno dell'Unione Sovietica: 5 (necessari altri dettagli?)
Sannicandro di Bari: 1 (stub)
Planet Manga: 1 (stubbissimo!)
Silandro: 5 (magari un po' migliorabile)
Nota: saltato Locate

Media: 3,1; Stima Varianza: 2,666667; Intervallo ancora troppo ampio (margine di 4,88829)

Utente:Timendum/Randomtest

Indice

Come funziona[modifica | modifica wikitesto]

Statisticamente[modifica | modifica wikitesto]

Come fare i conti[modifica | modifica wikitesto]

La Storia[modifica | modifica wikitesto]

Categorie[modifica | modifica wikitesto]

I risultati[modifica | modifica wikitesto]

16/06/2005[modifica | modifica wikitesto]

27/06/2005[modifica | modifica wikitesto]

11/07/2005[modifica | modifica wikitesto]

Menu di navigazione

Utente:Timendum/Randomtest

Come funziona[modifica | modifica wikitesto]

Statisticamente[modifica | modifica wikitesto]

Come fare i conti[modifica | modifica wikitesto]

La Storia[modifica | modifica wikitesto]

Categorie[modifica | modifica wikitesto]

I risultati[modifica | modifica wikitesto]

16/06/2005[modifica | modifica wikitesto]

27/06/2005[modifica | modifica wikitesto]

11/07/2005[modifica | modifica wikitesto]

Menu di navigazione

Ricerca