Wikipedia:Bar/Discussioni/Data mining su Wikipedia

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Data mining su Wikipedia


Ciao a tutti. Sto cercando di fare data mining sul database di Wikipedia. Ora, qualcuno l'ha mai fatto? O su qualche altro database? Giusto per capire quali strumenti avete usato e che risultati avete raggiunto :-)

--Filnik\b[Rr]ock\b 10:44, 29 mag 2012 (CEST)[rispondi]

che tipo di dati cerchi? --valepert 16:08, 29 mag 2012 (CEST)[rispondi]
Devo provare a utilizzare tecniche di clustering e pensavo di farlo utilizzando i dati di wikipedia. Più che altro il problema è trasformare il megafile xml in qualcosa di usabile... --Filnik\b[Rr]ock\b 17:30, 29 mag 2012 (CEST)[rispondi]
Xapian è già stato utilizzato in passato per far questo (che ovviamente funziona anche per it.wiki). modificare quickstartindex in modo tale che estragga ciò che ti serve non sembra, a naso, un'impresa titanica... --valepert 17:51, 29 mag 2012 (CEST)[rispondi]

Uhmm.. adesso ci do un'occhiata, thanks :) anche se a occhio quello fa indexing e non clustering. --Filnik\b[Rr]ock\b 20:52, 29 mag 2012 (CEST)[rispondi]