Wikipedia:Bar/Discussioni/La Wikipedia in svedese ha 1 milione di articoli

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

La Wikipedia in svedese ha 1 milione di articoli


Allora anche la wikipedia in svedese ha arrivato al suo primo milione di articoli. Informazion al sotto (inglese): "Swedish Wikipedia reach 1 million (with support of bots)"

Yesterday sv:wp reached 1 M articles. The one who did the passing was a bot generated article of a butterfly.
The bot behind this article is Lsjbot who creates articles from the database Catalogue of Life which (complemented by other databases) holds data of around 1.5 million species. The bot generates about 5,000 new articles per day and has generated just under 400,000 of the svwp million and is far from finished with its task...
The guy who runs the bot is in his civil life a university teacher. In this capacity he is also a guest lecturer at the university of the Philippines where he stayed the last couple of months (and during which time the bot was on hold). There he is active in Cebuano-language Wikipedia and supporting their local community, and he is nowalso running his bot on their wikipedia, as well as on Warai-Warai Wikipedia So perhaps at the end of the year these two language versions will also pass the 1 million mark!

Allora li articoli sulla wikipedia in svedese al frwp e enwp sono aggiornati. Forse un aggiornamento similare e possibile anche al itwp (la mia conoscienza di italiano non e professionale)? Più di teste i discussioni sul suggietto sono qui e qui (nel svedese!). --Paracel63 (msg) 15:33, 16 giu 2013 (CEST)[rispondi]

Fixato da Roberto Mura

Grazie per aver fixato le mie falte ortografiche. :-)--Paracel63 (msg) 20:16, 16 giu 2013 (CEST)[rispondi]
bravi agli svedesi :-) --Superchilum(scrivimi) 18:56, 16 giu 2013 (CEST) p.s. sti bot hanno fatto anche balzare nl.wiki a 1,6 M voci!! o_O[rispondi]
Si, molte wikipedie hanno utilizzato di bot, come plwp, viwp ed altre. Non sabbio la produzione utilizzando di bot a nlwp, ma penso che Lsjbot e utilizzato solamente a svwp, warwp e cebwp. :-)--Paracel63 (msg) 20:13, 16 giu 2013 (CEST)[rispondi]
Complimenti anche a loro, solo una cosa dove devo andare per fargli i complimenti? --Erik91☆☆☆ +1 (40mila edit sotto la Mole) 09:30, 17 giu 2013 (CEST)[rispondi]
E certamente una questione del futuro. Personalmente, ho creato il articolo sulla Mole. :-)--Paracel63 (msg) 23:04, 18 giu 2013 (CEST)[rispondi]
Ho messo qualche dato nella nostra voce sulla loro wikipedia --Erik91☆☆☆ +1 (40mila edit sotto la Mole) 09:54, 17 giu 2013 (CEST)[rispondi]

Avevo previsto il superamento su de.wiki a breve. LOL, con un'invasione di mosche e moscerini nl.wiki si è così piazzata al secondo posto. Se continueranno con questo ritmo nl.wiki diventerà la prima Wikipedia per un numero di articoli in meno di un anno.--Romero (msg) 12:42, 17 giu 2013 (CEST)[rispondi]

Dici che puntano a creare 3 milioni di voci in un anno D: ? --Erik91☆☆☆ +1 (40mila edit sotto la Mole) 14:38, 17 giu 2013 (CEST)[rispondi]
Complimenti... anche ai bot! :D --Ada-lin-gio 14:40, 17 giu 2013 (CEST)[rispondi]
Prima o poi finiscono anche gli insetti, ne esistono circa un milione di specie... Ma sono tutte enciclopediche, perché non le importiamo anche noi? --Bultro (m) 16:32, 17 giu 2013 (CEST)[rispondi]
Io sono sempre stato favorevole, non mi interessa nulla la classifica, credo davvero che alzerebbero la qualità complessiva di it.wiki. D'altronde voci come questa o questa (due prese a caso dal bot olandese e da quello svedese, rispettivamente) sono stub dignitosi, forniscono varie informazioni, tra cui quelle tassonomiche con l'apposito template, e rimandi di approfondimento in nota. La Treccani, la Rizzoli-Larousse, ecc., sono strapiene di voci definitorie monoriga. E non credo che qualcuno qui su it.wiki possa decidere in futuro di inserire a mano voci di milioni di specie, è il bot l'unica via.--Romero (msg) 18:13, 17 giu 2013 (CEST)[rispondi]

[a capo] Un IP ha spiegato bene qui perché l'operato della wikip olandese è molto arrischiato. Stanno in sostanza importando nomi di insetti, senza avere la menoma certezza che questi nomi (tassonomia) corrispondano a insetti effettivamente esistenti (biologia). Ringrazio il cielo che non siamo così avventati e che c'è qualcuno che ci ha voluto donare il proprio punto di vista e il conforto della competenza. Ben venga il lavoro di creazione dei bot, quando è condotto dall'intelligenza umana!!! --Pequod (talk76) 19:45, 17 giu 2013 (CEST)[rispondi]

Volevo aprire un altro post ma commento qui. Ci sono diversi punti da notare:
  • La Wikipedia tedesca elimina dalla classifica le wikipedia che hanno generato più della metà degli articoli usando dei bot (quella olandese, ad esempio)
  • Con Wikidata tutto questo uso dei bot non servirà più... i dati saranno accessibili a tutte le wikipedia centralmente, quindi il numero degli articoli schizzerà su
  • Nonostante tutto il bot può usare informazioni obsolete e caricare su Wikipedia informazioni sbagliate, infatte è una delle grosse critiche che viene fatta
Credo che la questione si chiarisca in futuro, tuttavia trovo l'idea della Wikipedia tedesca veramente ottima. -- Ilario^_^ - msg 22:39, 17 giu 2013 (CEST)[rispondi]
Ma infatti io non capisco questa mania del "cel'ho più lungo io", per quanto possa essere ben programmato un bot, non credo farà mai una pagina decente, avere un milione di pagine così non mi pare una cosa sensata (difatti in poco tempo ci hanno rimesso le mani sopra in 4-5). Per il resto, farei i complimenti al bot e al programmatore--Wim b 02:32, 18 giu 2013 (CEST)[rispondi]
Ilario non mi è chiaro cosa intendi con "La Wikipedia tedesca elimina dalla classifica..." quale classifica? Wim b, sono scuole di pensiero, ci sono certo pro e contro. Io sono sempre stato un po' scettico ma sicuramente trovo più utile una voce così rispetto a una così* (*il link alla secona non l'ho messo perché la voce ancora non esiste). --Phyrexian ɸ 02:57, 18 giu 2013 (CEST)[rispondi]
Phyrexian: certo, meglio una brutta che una mancante, però qui si parla di tante brutte scritte serialmente con l'unico scopo di impolpare il NS0 con qualcosa è un po' come se in un ristorante con 3 forchette Gambero Rosso ti dessero un panino di Burger King tanto per farti mangiare. Lo vedo solo come un motivo fiacco per festeggiare o complimentarsi, tutto qui, per il resto, probabilmente non c'è molto da dire su una farfalla.--Wim b 03:22, 18 giu 2013 (CEST)[rispondi]
Beh, ma a me quella voce non sembra affatto brutta, magari breve, ma c'è una bella differenza fra un sacco di voci brutte e un sacco di voci brevi. Quelle brutte per me sono quelle chilometriche e piene di immagini e diagrammi, scritte però in un linguaggio prescolastico e senza uno straccio di fonte. Poi io sono convinto che non siano state scritte con l'unico scopo di impolpare il Ns0. E riguardo a quanto si può scrivere sulle farfalle, anni fa creai questa voce, io non l'ho più maneggiata da allora perché non mi intendo dell'argomento, ma guarda oggi com'è diventata. ;-) --Phyrexian ɸ 03:41, 18 giu 2013 (CEST)[rispondi]
finora in questo hanno 4 Wikipedie sono diventate milionarie di voci,la prossima almento di stravogimenti dovrebbe essere quella polacca.--95.238.183.198 (msg) 14:06, 18 giu 2013 (CEST)[rispondi]

[a capo] Ma qui la questione non è un'invasione di stub su insetti. Se si trattasse di informazioni certamente corrette, fatto salvo quello che sta per accadere via wData, non potremmo avere niente da obbiettare sul modo di inserimento. Quindi cerchiamo di restare al dato concreto: la wp olandese ha creato numerosissimi stub su cavallette, di cui una buona parte potrebbe essere errata, in quanto non si riferisce a insetti, ma a nomi di insetti, tutto ciò nel contesto di tentativi tassonomici poi ritirati. Quindi imho l'operazione olandese, se così stanno le cose, è completamente folle. --Pequod (talk76) 17:15, 18 giu 2013 (CEST)[rispondi]

Esattamente, su questo non posso che essere d'accordo. --Phyrexian ɸ 18:07, 18 giu 2013 (CEST)[rispondi]
Il problema è questo perché l'obiettivo che raggiunge un bot come questo è avere voci, non voci di qualità. Mentre attraverso wikidata i dati sono controllati centralmente dai vari editors e, quindi, si condividono dati corretti. Il paradosso che si diceva è che la persona che ha portato sv.wikipedia ad oltre un milione di voci si starebbe preparando a caricare gli stessi dati sulla wikipedia in cebuano (una lingua delle Filippine) per cui vedremo questa wikipedia esplodere ma di voci che sono solo degli stub. -- Ilario^_^ - msg 23:03, 18 giu 2013 (CEST)[rispondi]
Veramente è già esplosa, ceb.wiki aveva 70.000 voci all'inizio di febbraio, ad oggi sono 360.000. Mi pare che lo stesso bot sia impegnato anche su war.wiki (in waray-waray, un'altra lingua delle Filippine) che oggi conta 377.000 voci, ma ne aveva meno della metà a marzo. --Phyrexian ɸ 00:58, 19 giu 2013 (CEST)[rispondi]
Esatto. -- Ilario^_^ - msg 11:34, 19 giu 2013 (CEST)[rispondi]
Beh io sarei più per un'enciclopedia dai contenuti organici e ben distribuiti. Per intenderci, su en.wiki non mi scandalizzerei nel vedere un bot che crea cinquecentomila stub di insetti (ovviamente insetti esistenti e con informazioni corrette!), dal momento che comunque anche senza di esse è un'enciclopedia già di per sé completa e molto ricca di contenuti, anzi può essere visto quasi come un arricchimento di qualcosa che già è di buon livello, quindi lo intenderei come un'aggiunta non squilibrante. Ma su progetti oggettivamente molto più piccoli e ancora meno approfonditi come nl.wiki, sv.wiki o peggio ancora ceb.wiki e war.wiki lo vedo come un atto squilibrante e sproporzionato. Con una similitudine, posso immaginare en.wiki come un dipinto di un pascolo molto ricco di dettagli, con fiori abbastanza definiti e un panorama di contorno, in cui con l'aiuto del bot posso iniziare a definire anche i singoli fili d'erba in alcune aree; su sv.wiki il bot disegna singoli fili d'erba su un dipinto dove a mala pena sono definite a grandi linee le staccionate del pascolo e il cielo è una strisciata blu uniforme. Su ceb.wiki lo stesso bot disegna fili d'erba su un dipinto in cui ancora non si delinea nemmeno il pascolo. --Roberto Segnali all'Indiano 13:51, 19 giu 2013 (CEST)[rispondi]
Se ne occupa il Corsera.--Pạtạfisik 13:56, 19 giu 2013 (CEST)[rispondi]
penso che, oltre alle questioni di "meglio la qualità alla quantità" (se le informazioni sono corrette ben vengano i bot a creare le voci se ci mettono molto meno degli umani) o "le informazioni inserite non sono del tutto corrette" (cosa IMHO gravissima), il punto esposto da Roberto Mura sia fondamentale. Ha senso una crescita dell'enciclopedia proporzionale alla comunità che la gestisce. Se le voci diventano enormemente superiori alla possibilità della comunità diventano deserte (e se le info rischiano di non essere corrette, resteranno tali per sempre) o vandalizzabili molto facilmente senza che si possa far fronte facilmente. Quindi hanno senso inserimenti limitati e controllati periodicamente da utenti "umani" (mi pare che sia enzimi che asteroidi siano stati creati in questo modo), ma operazioni come quelle sulle Wikipedie filippine IMHO sono da manicomio. --Superchilum(scrivimi) 10:36, 20 giu 2013 (CEST)[rispondi]
In linea di massima io non sarei contrario a operazioni come quelle, però da manicomio è usare un bot per spammare informazioni non accurate. Un conto è se un utente fa un errore, ma un bot che scrive scemenze non ha senso di esistere. Posto che il bot abbia un margine d'errore dello 0%, anche in una Wikipedia con una piccola comunità non vedrei male una crescita vertiginosa delle voci, è anche a questo che tendono i nostri sforzi, e un numero alto di voci può anche incentivare la crescita della comunità, il problema principale è la gestibilità delle voci, e quindi si ritorna al punto di prima: non possiamo permetterci che su Wikipedia siano scritte delle scemenze. Una comunità che non è "fisicamente" in grado di gestire tutte le voci in tempo reale dovrebbe assolutamente correre ai ripari, magari (come già fanno alcune wiki anche grandi) ricorrendo alla versione verificata delle pagine, da mostrare agli utenti, e tenere nascoste le ultime modifiche in attesa di revisione. Questa è l'unica soluzione che mi viene in mente ora. --Phyrexian ɸ 10:51, 20 giu 2013 (CEST)[rispondi]

A margine, vorrei far notare come anche noi, oltre ai già citati asteroidi, abbiamo usato il "trucchetto" del bot anche per le voci di millemila comuni stranieri e pure per i film (e con errori, ogni tanto qualcuno va in cancellazione perché palesemente non enciclopedico...) e per Dio solo sa cos'altro. Quindi guardiamo prima la trave nel nostro occhio. ^__^--MidBi 10:58, 20 giu 2013 (CEST)[rispondi]

A margine noto ora che a suon di farfalline sv.wiki ci ha superato nella classifica di chi ce l'ha più lungo, ora siamo sesti. :-( --Phyrexian ɸ 10:59, 20 giu 2013 (CEST)[rispondi]
Secondo voi alla Merriam erano contenti di avere una parola in più (dord) che tutti gli altri dizionari? No, perché quella parola non esisteva. Il problema sta tutto qui: se andiamo di bot per cose che esistono, dove sta il problema? Ma magari potessimo importare via bot lo scheletro di alcune voci su dischi!! Voci che io avrei scritto volentieri se non avessi dovuto sorbirmi tutta la menata del tmp {{tracce}}. Speriamo che wData chiuda il conto con queste dinamiche! :) --Pequod (talk76) 17:35, 20 giu 2013 (CEST)[rispondi]

Non ho nulla contro la botolazione, ma alcuni strascichi del 2005 li stiamo smaltendo/abbiamo smaltiti solo ora, parlo delle orfane di vini, di minerali e delle simpatiche paginette di cortometraggi che mando in pdC al ritmo di una ogni 1-2 mesi.

Sicuramente adesso siamo molto più attrezzati e smaliziati, vedasi i festival delle voci non editate da veri utenti et similia, ma è evidente che si debba sempre procedere con senso della misura, si sta comunque innestando qualcosa su un corpo che necessita di una crescita armonica, senza ancora aver ben compreso quali parametri ne caratterizzino "l'armonicità", visto che wiki è in evoluzione continua. Insomma se nessuno ha fatto ancora 50000 voci di un certo tipo è evidente che c'è un motivo di fondo, il bot cancella l'effetto, certo non la causa prima della mancanza.

Per me il "principio" è sempre stato che un bot deve automatizzare il lavoro di un utente "che già esiste", non di qualcuno che rischia di non esistere mai. Volendo parametrizzare il concetto, per me l'inserimento botolatore:

1) dovrebbe avvenire in aree tematiche di progetti ATTIVI
2) dovrebbe avere una struttura di conettività e di categorizzazione chiara e netta prima di iniziare
3) non dovrebbe superare mai una cosa tipo l'1-2% delle voci totali.
4) se di dimensioni consistenti, dalle 1000 in su, dovrebbe sempre essere approvato da una discussione generale.
5) implicitamente dovrebbe sempre essere basato su wikidata, e dunque dovrebbe esistere sempre una voce almeno in un'altra lingua se possibile (meglio non abusare i bot "per fughe in avanti", mi limiterei solo a "tenere il passo", con moderazione).

Inoltre, così come sono contrario a conteggiare nel totale del ns0 le voci isolate se non presenti su altre wikipedia, analogamente nella comparazione "fra le wiki" secondo me nessuna voce creata da bot deve essere ritenuta "tale" finché non è stata editata da almeno un altro utente. Possibilmente io ci metterei anche un bell'avviso tipo "questa è una voce creata da bot, per favore rimuovi l'avviso dopo che l'hai letta e ti sei assicurato che è una voce sensata"--Alexmar983 (msg) 18:23, 21 giu 2013 (CEST)[rispondi]

Già dal 2008 le m:Top Ten Wikipedias non danno i numeri ma guardano al numero di visite che i progetti ricevono. In https://www.wikipedia.org/ sv.wiki e nl.wiki non faranno mai capolino e it.wiki è stabilmente settima (anche se si spera pt.wiki ci superi presto: i numeri attuali sono indice di grave sottosviluppo, data la popolazione globale che parla la lingua). --Nemo 19:21, 21 giu 2013 (CEST)[rispondi]