Discussione:Analisi delle frequenze

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Sono poco convinto che "Linguistica" sia una categoria adatta. Lo sarebbe sicuramente se la pagina parlasse solo delle "frequenze" in sé, ma l'articolo parla (o dovrebbe farlo) di come utilizzare le frequenze come metodo di crittanalisi, quindi lascerei solo crittografia come categoria. Lapo Luchini 08:31, Ott 25, 2004 (UTC)

Nell'articolo non viene specificata la provenienza dei dati della frequenza relativa delle lettere. Per esempio se provengono da un testo letterario o da campioni di testo come articoli di giornale, recensioni, ecc. Il lettore dovrebbe conoscere sia la provenienza dei dati sia la quantità, poichè un campione ristretto può portare a fluttuazioni considerevoli. Realizzerò quindi una paginetta con le frequenze della divina commedia. Utente:zaldo 10.00, 29 lug 2009

sono d'accordo con Utente:zaldo che manca la fonte dei dati. Inoltre la somma delle frequenze mi pare faccia 99.95. Utente:dueduesettimi 10:36, 17 dic 2013
Solito problema di cattivo arrotondamento dei decimali.--Bramfab Discorriamo 11:11, 17 dic 2013 (CET)[rispondi]
Ho scritto un piccolo programma per verificarlo e l'ho provato con tre libri usando come input i txt ricavati dagli ebook: la divina commedia, "dopo il divorzio" di grazia deledda e "il pendolo di Foucault" di Umberto Eco. In effetti il risultato può variare abbastanza notevolmente, ma resta comunque abbastanza vicino a quello indicato. vi allego due pastebin con il codice del programma in c(attenzione:le lettere accentate saranno ignorate quindi vanno rimpiazzate con quelle di base) e le frequenze che ho trovato:
codice http://pastebin.com/fV4KcxAj; frequenze http://pastebin.com/tqKxPtAX --78.12.238.168 (msg) 22:12, 11 gen 2014 (CET)[rispondi]