Wikipedia:Bar/Discussioni/Semantic Wikipedia please

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Semantic Wikipedia please NAVIGAZIONE


L'altro giorno stavo provando il foglio di calcolo Google document, e la funzione "GoogleLookup(entità; attributo)".

Questa funzione non fa altro che cercare il valore di un attributo di una qualunque entità sul web, inclusa Wikipedia. Ad esempio, entità Italy, attributo population, il valore desiderato è la popolazione dell'Italia. Per provare in una colonna del foglio di calcolo incollo i nomi (in inglese) di tutti gli stati europei. Nell'intestazione delle colonne successive inserisco degli attributi, e poi incollo in tutte le celle la funzione. Con l'attributo "Capital" funziona bene, ottengo automaticamente le capitali di oltre 50 stati europei, che Google recupera dal sito della CIA. Vi sono solo pochi errori, ad esempio la capitale dell'Albania: "41 20 N, 19 50 E". Quindi complessivamente il dato delle capitali sul sito della CIA è abbastanza ben relazionato agli Stati.

Se come attributo metto "population" ottengo in quasi tutti gli stati un numero con tra parentesi una data, che presumibilmente indica la rilevazione).

Ad esempio:


Belarus Capital: Minsk - Population: 10,293,011 (July 2006 est.)
Belgium Capital: Brussels - Population:  10,379,067 (July 2006 est.)
Bosnia and Herzegovina Capital: Sarajevo - Population: 4,498,976 (July 2006 est.)
Bulgaria Capital: Sofia - Population: 7,385,367 (July 2006 est.)
Croatia Capital: Zagreb	 - Population: 4,494,749 (July 2006 est.)
Cyprus Capital: Nicosia	 - Population: 784,301 (July 2006 est.)
Czech Republic Capital: Prague	 - Population: 10,235,455 (July 2006 est.)
Estonia Capital: Tallinn	 - Population: 1,324,333 (July 2006 est.)
Finland Capital: Helsinki	 - Population: 5,231,372 (July 2006 est.)
France Capital: Paris	 - Population: 63,056,200
Georgia Capital: T'bilisi	 - Population: 4,661,473 (July 2006 est.)
Germany Capital: Berlin	 - Population: 82,422,299 (July 2006 est.)
Gibraltar Capital: Gibraltar  - Population: 36°8′N 5°21′W	4,290/km² (5th)
Greece Capital: Athens	 - Population: 10,688,058 (July 2006 est.)
Hungary Capital: Budapest	 - Population: 10,074,000
Iceland Capital: Reykjavik	 - Population: 299,388 (July 2006 est.)
Ireland Capital: Dublin	 - Population: 4,148,000
Italy Capital: Rome	 - Population: 58,133,509 (July 2006 est.)
Kazakhstan Capital: 	Astana	 - Population: 15,233,244 (July 2006 est.)

Qui cè già un problema. Non posso fare come volevo un grafico o una elaborazione dei dati numerici sulla popolazione, perchè i numeri sono mischiati all'informazione sulla data di rilevazione. Peccato, spesso il grande valore aggiunto delle informazioni risiede nella loro disponibilità ad essere elaborabili automaticamente, senza ulteriori trattamenti.

Se io cambio il valore dell'entità, ed al posto della colonna con il nome dello stato, indico la colonna con il nome della capitale ottengo dei valori recuperati da wikipedia.

In alcuni casi vi sono dati che sembrano rispondere al questito, anche se per la popolazione vi è sempre una data aggiuntiva, ad esempio: Vienna (Austria): Population: 1,651,437 (31.12.2005) 2,165,357 metro area Mayor (Sindaco): M. Jane Seeman

Ma in molti altri casi i dati sono errati.

Brussels (Belgio): Population: 200/km² (656/sq mi) (2005) niente sindaco

Rome (Italy): Population: 2,6 m Niente sindaco.

Moscow (Russia): Population: 10.5 m Mayor: Yuriy Luzhkov

Stessi problemi anche su altri attributi, ad esempio per Rome: Elevation: +20 m (66 ft) Density: 180.1/km² (466.4/sq mi) (2000)


Wikipedia è una sorgente immensa di informazioni fruibili principalmente come un'enciclopedia tradizionale, da essere umani direttamente,anche con l'ausilio di ricerche testuali. Ma nel rapido cammino verso il web semantico o web 3, vince chi è capace di strutturare le informazioni in modo dapoter essere selezionate, valutate ed elaborate da sistemi automatici prima di essere presentate agli esseri umani. Per questo sarebbe utile definire e promuovere ed in qualche modo forzare al più presto policy e linee guida, almeno di base, come quelle presentate nella voce "Wikipedia: Semantic Wikipedia[1]" (vedi anche [2], in modo da mettere a disposizione di tutta la rete in maniera efficace il mare di conoscenza rappresentato da wikipedia. Questo commento senza la firma utente è stato inserito da Fcotroneo (discussioni · contributi).

Tuttavia ricordiamoci che wikipedia e' una enciclopedia, non un database ideato per web 3.0, e non deve essere forzata a ridiventare tale, altrimenti viene snaturata ed il valore di wikipedia non credo stia nella capacita' di fornire elenchi di capitali o di abitanti (buoni per i quiz televisivi) quanto piuttosto nell' avere voci scritte in modo tale che leggendole si arrivi a conoscere la città di Mosca e magari capire perché' ha più' abitanti di Vladivostock. Inoltre i sistemi semantici dovrebbero per l' appunto possedere una certa intelligenza che permetta loro di ricercare informazioni tra documenti diversi. Se web 3.0 significasse che tutte le fonti delle ricerche semantiche finiscano per essere ridotte a pochi siti (sia pure di enormi dimensioni) allora sarebbe un brutto balzo all' indietro verso un mondo in cui il sapere ritorni a pretendere di poggiarsi acriticamente su qualche libro sacro e risulti fondato su una serie di nozioni senza analisi critiche o una ricerca/approfondimento sulle stesse.--Bramfab Discorriamo 09:43, 12 giu 2008 (CEST)[rispondi]
Beh, se google desidera tanto fare un web-semantico, che si adegui lui a wikipedia, non noi a Google. -- Xander  サンダー 12:30, 12 giu 2008 (CEST)[rispondi]
Inserire tag semantici in tutte le voci sarebbe una complicazione insostenibile e incomprensibile per la maggior parte degli utenti, ma in certi template, tipo il Template:Comune, si potrebbe benissimo fare. Presuppone pero' che Google pubblichi la sintassi dei tag da usare.
Il problema dei dati errati penso sia che la funzione di Google ricerca la parola "popolazione" e poi come valore ci mette il primo numero che le capita a tiro. Se il dato della popolazione non c'e', ci mette l'altitudine o la densita' o qualunque altra cosa trovi per prima. Non credo che noi ci si possa fare niente (a parte inserire i dati dove mancano), e' Google che dovrebbe fare una funzione piu' intelligente, ma non e' mica una cosa semplice. --Gerardo 12:45, 12 giu 2008 (CEST)[rispondi]

Sono daccordo con Bramfab sul fatto che il web semantico non deve essere ridotto a pochi siti che hanno grandi quantità di dati strutturati. Però fornire un'efficace struttura semantica anche a wikipedia darebbe ulteriore valore aggiunto ai suoi utenti, consentendo per esempio di reperire ed elaborare in modo rapido le informazioni desiderate. Ad esempio se a me serve sapere quali sono le cinquanta più grandi città del mondo con un sindaco donna, wikipedia potrebbe darmi in tempo reale l'elenco.

Del resto il progetto Semantic Mediawiki [3] (da dove ho preso l'esempio del sindaco donna) ha già predisposto le regole e gli strumenti per farlo, bisogna ora che la comunità di wikipedia inizi a discutere ed a valutare le modalità concrete di avvio dell'iniziativa, a cominciare dalla definizione di un primo nucleo di specifiche policy e linee guida. Fcotroneo (msg) 15:43, 12 giu 2008 (CEST)[rispondi]

Vedo con piacere che non sono l'unico a proporre la semantica per wikipedia in modo diretto. Spero che le cose si muovano in tempi ragionevoli. Sarebbe un enorme passo in avanti.
@Bramfab: wikipedia dovrebbe essere un'enciclopedia, ma in realtà è molto di più, non perdiamo questa occasione. --wiso (msg) 14:21, 17 giu 2008 (CEST)[rispondi]