MNIST database

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search

La base di dati MNIST (modified National Institute of Standards and Technology database) è una vasta base di dati di cifre scritte a mano che è comunemente impiegata come insieme di addestramento in vari sistemi per l'elaborazione delle immagini[1][2]. La base di dati è anche impiegata come insieme di addestramento e di test nel campo dell'apprendimento automatico[3][4]. La base di dati è stata creata rimescolando le immagini presenti nell'insieme di dati del NIST.

MNIST sample images.
Un esempio dei dati di test del MNIST

La base di dati MNIST contiene 60 000 immagini di addestramento e 10 000 immagini di test[5]; metà dell'insieme di addestramento e metà dell'insieme di test sono state prelevate dall'insieme di addestramento del NIST, mentre le altre metà sono state ottenute dall'insieme di test del NIST stesso[6]. Diversi lavori riportati su pubblicazioni scientifiche si sono focalizzati sull'obiettivo di ottenere un basso tasso di errore; in una pubblicazione, che documenta un lavoro basato sull'utilizzo di un sistema gerarchico di reti neurali convoluzionali, viene riportato un tasso di errore dello 0,23 %[7]. Gli autori dell'insieme di dati MNIST mantengono una lista di alcuni metodi che sono stati impiegati su di esso[8]: essi hanno utilizzato, nella loro pubblicazione originaria, una SVM, ottenendo un tasso di errore dello 0,8 %[9].

L'insieme dei dati[modifica | modifica wikitesto]

Le immagini presenti nella base di dati sono la combinazione di due basi di dati nel NIST: lo Special Database 1 e lo Special Database 3, che sono costituiti rispettivamente da cifre scritte a mano da studenti delle scuole superiori e da impiegati dell'ufficio censimento[8].

Note[modifica | modifica wikitesto]

  1. ^ (EN) Support vector machines speed pattern recognition - Vision Systems Design, su Vision Systems Design. URL consultato il 17 agosto 2013.
  2. ^ (EN) Sachin Gangaputra, Handwritten digit database, su cis.jhu.edu. URL consultato il 17 agosto 2013.
  3. ^ (EN) Qiao Yu, THE MNIST DATABASE of handwritten digits, su gavo.t.u-tokyo.ac.jp, 2007. URL consultato il 18 agosto 2013 (archiviato dall'url originale l'11 febbraio 2018).
  4. ^ (EN) John C. Platt, Using analytic QP and sparseness to speed training of support vector machines (PDF), in Advances in Neural Information Processing Systems, 1999, pp. 557–563. URL consultato il 18 agosto 2013 (archiviato dall'url originale il 4 marzo 2016).
  5. ^ Ernst Kussul e Tatiana Baidyk, Improved method of handwritten digit recognition tested on MNIST database, in Image and Vision Computing, vol. 22, n. 12, 2004, pp. 971–981, DOI:10.1016/j.imavis.2004.03.008.
  6. ^ Bin Zhang e Sargur N. Srihari, Fast k -Nearest Neighbor Classification Using Cluster-Based Trees (PDF), in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, n. 4, 2004, pp. 525–528, DOI:10.1109/TPAMI.2004.1265868, PMID 15382657. URL consultato il 18 agosto 2013.
  7. ^ Dan Cires¸an, Ueli Meier e Jürgen Schmidhuber, Multi-column deep neural networks for image classification (PDF), in 2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012, pp. 3642–3649, DOI:10.1109/CVPR.2012.6248110, ISBN 978-1-4673-1228-8, arXiv:1202.2745.
  8. ^ a b Yann LeCun, Corinna Cortes e Christopher J.C. Burges, MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges, su yann.lecun.com. URL consultato il 17 agosto 2013.
  9. ^ Yann LeCun, Léon Bottou, Yoshua Bengio e Patrick Haffner, Gradient-Based Learning Applied to Document Recognition (PDF), in Proceedings of the IEEE, vol. 86, n. 11, 1998, pp. 2278–2324, DOI:10.1109/5.726791. URL consultato il 18 agosto 2013.

Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Informatica Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica