Cross-validazione

Da Wikipedia, l'enciclopedia libera.
Vai a: navigazione, cerca

La cross-validazione (cross-validation in inglese) è una tecnica statistica[1] utilizzabile in presenza di una buona numerosità del training set. In particolare la k-fold cross-validation consiste nella suddivisione del dataset totale in k parti (si chiama anche k-fold validation) e, ad ogni passo, la parte (1/k)-esima del dataset viene ad essere il validation dataset, mentre la restante parte costituisce il training dataset. Così, per ognuna delle k parti (di solito k = 10) si allena il modello, evitando quindi problemi di overfitting, ma anche di campionamento asimmetrico (e quindi affetto da bias) del training dataset, tipico della suddivisione del dataset in due sole parti (ovvero training e validation dataset).

Indice

[modifica] Note

  1. ^ Metodo Cross-validation

[modifica] Voci correlate

[modifica] Bibliografia

  • I. Witten, E. Frank: Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann
  • R. Duda, P. Hart, D. Stork: Pattern Classification, Wiley
  • T. Hastie, R. Tibshirani, J. Friedman: The Elements of Statistical Learning, Springer

[modifica] Collegamenti esterni

Strumenti personali
Namespace
Varianti
Azioni
Navigazione
Comunità
Stampa/esporta
Strumenti
Altre lingue