Box-plot

Da Wikipedia, l'enciclopedia libera.

Il box-plot (o semplicemente boxplot o anche box & whiskers plot – letteralmente: "diagramma a scatola e baffi") è una forma di rappresentazione grafica in statistica.

|
|        .        <- valore osservato 
|                     al di fuori dei "baffi" (outlier) 
|                     [x_max = Q4] 
|
+      --+--      <- Q3 + 1,5 (Q3-Q1)
|        |
|        |
|        |
|        |
|        |
|        |
|    +---+---+      <- Q3
|    |       |
|    |       |
+    |       |
|    |       |
|    |       |
|    +-------+      <- Q2 = Mediana
|    |       |
|    |       |
+    |       |
|    |       |
|    |       |
|    |       |
|    |       |
|    +---+---+      <- Q1
+        |
|        |
|        |
|        |
|        |
|        |
|        |
|        |
|        |
|      --+--      <- Q1 - 1,5 (Q3-Q1) [x_min = Q0]
|      
|
+----------+----------+----------+----------+------>

Serve per descrivere in modo compatto e grafico la distribuzione di una variabile.

È il disegno su un piano cartesiano di un rettangolo, i cui estremi sono il primo e terzo quartile (Q1 e Q3), è tagliato da una linea all'altezza della mediana (Q2). Il minimo della distribuzione viene indicato con (Q0), mentre il massimo con (Q4).

Abitualmente vengono aggiunte due righe (detti anche baffi) corrispondenti ai valori distanti 1,5 volte la distanza interquartile a partire rispettivamente dal primo e dal terzo quartile.

Alle volte vengono anche rappresentati nel grafico i valori che fuoriescono dall'intervallo delimitato dalle due righe come punti isolati

Pare che a John Wilder Tukey venne chiesto perché nella determinazione dei valori adiacenti superiore ed inferiore fosse stata scelta una distanza limite dai quartili pari a 1,5 e lui avrebbe risposto "perché 1 è poco e 2 troppo".

Strumenti personali