Discussioni Wikipedia:Elenchi generati offline: differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Fale (discussione | contributi)
Riga 123: Riga 123:
::Bello, ma funzionerà a lungo termine anche in tua assenza?
::Bello, ma funzionerà a lungo termine anche in tua assenza?
::In caso affermativo andrebbe pubblicizzato inserendo link diretti agli elenchi nelle pagine di servizio correlate, ad esempio quelli riguardanti le categorie in [[progetto:Categorie]] --[[Utente:Bultro|Bultro]] ([[Discussioni utente:Bultro|m]]) 14:38, 3 lug 2013 (CEST)
::In caso affermativo andrebbe pubblicizzato inserendo link diretti agli elenchi nelle pagine di servizio correlate, ad esempio quelli riguardanti le categorie in [[progetto:Categorie]] --[[Utente:Bultro|Bultro]] ([[Discussioni utente:Bultro|m]]) 14:38, 3 lug 2013 (CEST)
:::@Incola: Effettivamente quello che affermi è vero. Sto già lavorando per permettere anche l'esecuzione di script python che parsano il dump per questa evenienza
:::@Bultro: Assolutamente si: gli script sono tutti crontabbati (quindi si auto-eseguono) e il ToolLabs permette di avere più gestori per lo stesso progetto, quindi se altri utenti ToolLabs si fanno avanti, li posso accettare nel progetto e così ogniuno di noi diventa completamente intercambiabile per eventuali aggiunte e miglioramenti di query e del codice. [[Utente:Fale|Fale]] ([[Discussioni utente:Fale|msg]]) 12:50, 4 lug 2013 (CEST)

Versione delle 12:50, 4 lug 2013

{
}
-
/usr/bin
Foo Bar

Benvenut* nel bar degli elenchi generati offline! Nell'augurarti una buona permanenza ti ricordo alcune regole:

Bot + xml / query + sql

Spesso a Wikipedia:Bot/Richieste viene chiesto di generare delle liste. La cosa si traduce nella creazione di una regex e nella ricerca tramite dump xml con un bot. Mi chiedo se questo non è più un lavoro adatto ad una ricerca tramite query su un database sql. Potremmo definire questo confine in modo da poter indirizzare meglio le richieste? --wiso 13:51, 13 dic 2007 (CET)[rispondi]

Certo, ho aggiunto una nota al box. Va bene? --Pietrodn · «zitto e parla!» 17:36, 13 dic 2007 (CET)[rispondi]
Bo, potrebbe. Vorrei avere il parere di qualcuno esperto nella generazione degli elenchi tramite sql, per cercare di capire quando è meglio usare un xml e un bot o sql e una query. Io no so molto poco, ho provato ad installare wikipedia sul mio computer, ma quando dice di aver caricato tutte le voci in realtà ne ha caricate solo la metà. Ho provato anche a fare qualche ricerca con delle query nel database. Effettivamente i tempi sono un po' più veloci. Però vorrei capire quanto più veloci e se ci sono dei casi di generazione di liste che invece sono più adatti a dei bot. --wiso 18:46, 13 dic 2007 (CET)[rispondi]
Chiedi lumi a Lp e agli altri che refreshano le liste (al primo, dì che t'ho mandato io...) --Elitre 01:57, 14 dic 2007 (CET)[rispondi]
E' un po' che non uso né bot né query. Comunque, per me, è difficile dare una regola generale, se ci cercano tutte le voci in cui compare una parola penso sia meglio usare sql, se invece vogliamo tutte le pagine di una categoria (se non ricordo male) è più veloce un bot. Ci sono tipi di ricerche che usando l'xml sono difficili (esempio, almeno per me :)), ma se si deve cercare qualcosa per poi modificarla in tutte le occorrenze, ovviamente un bot ha il vantaggio che può editare direttamente. Per il resto si dovrebbe valutare caso per caso. β16 - (talk) 12:47, 14 dic 2007 (CET)[rispondi]
Quoto in pieno Beta16, non è possibile dare una regola generale. Per generare l'elenco di tutte le pagine in una categoria, non so quale dei due metodi sia più veloce, è una questione di secondi. Ricordo che è anche disponibile un dump con la tabella delle categorie. @wiso: Per importare più velocemente i dump nel tuo database usa MWDumper. ;-) --Pietrodn · «zitto e parla!» 18:20, 14 dic 2007 (CET)[rispondi]
È proprio quello che ho fatto. Però risulta incompleta, ci sono un sacco di link rossi. E poi, ogni volta che carico un dump nuovo come faccio a cancellare la vecchia versione per non dover usare 2 Gb ogni volta che scarico un dump? --wiso 21:55, 14 dic 2007 (CET)[rispondi]

(Torno a sx e scusate il ritardo) In generale credo che per le ricerche nel corpo del testo i due metodi possano essere equivalenti, anche se non so quanto ci mette un bot a scorrere il dump XML. Tutte le ricerche che possono appoggiarsi a una delle tabelle aggiuntive (uso di categorie, immagini, interwiki, link interni ed esterni, template, redirect, ecc. - qui uno schema aggiornato del DB) dovrebbero invece essere molto più rapide via SQL, a patto di importare i rispettivi dump o farli ricostruire a MediaWiki. Alcuni dati, in particolare i log, sono disponibili solo via SQL.

Per quanto riguarda l'importazione da mwdumper, controlla che non ci siano stati errori di timeout o pacchetti troppo grandi a metà, perché lui continua comunque fino in fondo; io aumento i valori prima dell'importazione e rinuncio anche a qualche altro controllo:

SET global MAX_ALLOWED_PACKET =32768000;
SET global CONNECT_TIMEOUT = 60;

SET session AUTOCOMMIT=0;
SET session UNIQUE_CHECKS=0;
SET session FOREIGN_KEY_CHECKS=0;

Un'altra cosa da controllare per evitare link rossi in un mirror locale è di aver inserito i namespace personalizzati di Wikipedia in italiano nel file Localsettings.php, e di aver attivato le sottopagine per gli stessi namespace dove sono attive qui:

$wgExtraNamespaces =
	array(100 => "Portale", 101 => "Discussioni_portale", 102 => "Progetto", 103 => "Discussioni_progetto" );
$wgNamespacesWithSubpages = 
        array(-1=>0, 0=>0, 1=>1, 2=>1, 3=>1, 4=>1, 5=>1, 6=>1, 7=>1, 8=>1, 9=>1, 10=>0, 11=>1, 100=>1, 101=>1, 102=>1, 103=>1 );

Infine, per sovrescrivere il dump precedente basta svuotare prima le tabelle su cui lavora mwdumper:

TRUNCATE page;
TRUNCATE revision;
TRUNCATE text;

Se serve altro chiedete pure... --Lp 13:58, 22 dic 2007 (CET)[rispondi]

Dump

Ciao scusa se mi intrometto, mi chiamo Roberto Gerlando; volevo chiederti cosa puoi dirmi su gli static html dump. Che fine hanno fatto? Saluti da Trapani

Mi sa che ti ha risposto Gig allo sportello informazioni. Vedi QUI Jalo 01:08, 6 mag 2008 (CEST)[rispondi]

Voci contenenti la parola xxx

Ho visto l'elenco di voci contenenti la parola "purtroppo". Ottima idea! Penso che sarebbero utili anche elenchi di voci contenenti parole come "ultimamente", "recentemente", "attualmente" e simili (che non si sa mai a quando si riferiscono). A chi devo suggerirlo? --Lou Crazy (msg) 22:50, 25 ago 2008 (CEST)[rispondi]

Pagine più richieste

Sarebbe possibile aggiornare l'elenco delle Pagine più richieste visto che è fermo a più di un anno fa?--Knoxville (msg) 12:05, 3 nov 2008 (CET)[rispondi]

Si può smettere di generare Wikipedia:Elenchi generati offline/Da tradurre non categorizzati (e altre analoghe se ce ne sono), ora i maggiori template di avviso hanno categorie come Categoria:Da tradurre - non datate e Categoria:Da tradurre - argomento sconosciuto, riempite in automatico --Bultro (m) 19:28, 9 dic 2008 (CET)[rispondi]

Ci dev'essere qualcosa che non va

Non capisco come mai la voce San Giorgio (Brunico) (con la vecchia denominazione San_Giorgio_-_St._Georgen) sia finita nell'elenco Wikipedia:Elenchi generati offline/Quote nella sezione iniziale/2. Questa voce l'ho scritta io che notoriamente non amo le frasette iniziali, e non ha né mai ha avuto un quote nell'incipit o prima dell'incipit. L'unico quote esistente nella voce è al paragrafo 3.2 (lingua), appunto per illustrare la lingua della località. Mi vengono dei dubbi su come funzioni il bot che mette insieme questi elenchi... --Vermondo (msg) 01:01, 25 mar 2009 (CET)[rispondi]

Riguardando un attimo quell'elenco, mi sono accorto che anche altre voci ivi segnalate sono prive di questo quote iniziale (per esempio PKNA 1, PKNA 2, PKNA 3 ecc...). Mi sa che il bot "prende" anche cose che quote non sono. Saranno da rivedere le istruzioni. Io non ci capisco un ette, ma visto il tipo di voci che vengono pescate, mi domando se non c'entri il fatto che sono tutte dei "redirect". Non è che per qualche strano motivo il bot legga come quote i redirect? --Vermondo (msg) 11:38, 25 mar 2009 (CET)[rispondi]
Questi elenchi non vengono generati da un bot, ma con una interrogazione al database e riportano quindi dei dati congelati al momento in cui l'elenco viene prodotto. Per quanto riguarda i redirect, le pagine che hai segnalato avevano, quando l'elenco è stato generato, il template quote nella sezione iniziale (esempio). Per la voce San Giorgio (Brunico) si tratta del quote posto nel paragrafo sulla lingua e della particolare disposizione delle parole successive grassettate: è uno dei tanto falsi positivi che si trovano facendo una ricerca che dovrebbe tener conto di tantissime variabili. --Incola (posta) 20:16, 30 mar 2009 (CEST)[rispondi]

Interlink

Ho cambiato l'interlink a en.wiki. Vero è che quella pagina è inattiva, ma prima si puntava a en:WP:Maintenance, che però, a sua volta, puntava a WP:Lavoro sporco. --Ginosal 2.0 15:10, 26 mag 2009 (CEST)[rispondi]

Avviso

Ho categorizzato molti degli elenchi (ad es. in categoria:gestione categorie quelli che riguardano le categorie) sperando che siano più visibili ai potenziali "lavoratori sporchi" interessati. Visto che sono raggiungibili in vari modi, che ne dite di mettere un template di avviso in cima a ogni elenco, che spiega brevemente cos'è un EGO e dove si può chiedere di aggiornarlo? --Bultro (m) 00:11, 30 nov 2010 (CET)[rispondi]

... non vedo molto interesse, cmq ho creato Template:EGO, ditemi se qualcosa non va --Bultro (m) 22:45, 13 dic 2010 (CET)[rispondi]
Ho cambiato il template che ora richiede obbligatoriamente la data a cui si riferisce il dump o l'estrazione. In questo modo nella Categoria:Elenchi generati offline non aggiornati vanno a finire tutti gli elenchi che hanno bisogno di un aggiornamento. Se un elenco ha esaurito i propri scopi o non è più utile si può inserire il parametro storico in modo da categorizzarlo come Categoria:Elenchi generati offline obsoleti, cosicché rimangono da aggiornare solo quelli ancora utili.
Ho cercato di inserire il template in tutti gli elenchi fin'ora generati, spero che in quelli nuovi verrà inserito il template.
Per quanto riguarda i seguenti elenchi:
credete si possa inserire il parametro "storico", ormai i comuni italiani sono voci abbastanza complete, almeno per quanto riguarda i dati del template. --β16 - (talk) 11:20, 17 feb 2012 (CET)[rispondi]
Si, anche perché estraevano i dati dal Template:Comune che non esiste neanche più... Mi chiedo piuttosto se questi elenchi "storici" non convenga cancellarli proprio --Bultro (m) 15:40, 17 feb 2012 (CET)[rispondi]
Mah, sono utili per conoscere la storia di it.wiki, capire quali sono stati i problemi avuti nelle prime fasi di crescita del progetto, come tutte le altre pagine contenute in questa categoria. Basta distinguerli da quelle effettivamente ancora usati. --β16 - (talk) 18:24, 17 feb 2012 (CET)[rispondi]
...no, non riesco a vederci alcuna utilità. Affollano solo le ricerche e sono fuorvianti, perché non spiegano che sono obsoleti e il perché. Almeno quelli dei comuni sono da cassare --Bultro (m) 15:21, 9 lug 2012 (CEST)[rispondi]

Ristrutturazione delle pagine EGO

Segnalo che, in base a questo thread è stata avviata una ristrutturazione delle richieste di EGO e, conseguentemente, della pagina wp:EGO.

Due appunti:

  • Modificherei il Template:TestataEGO in modo che l'immagine scelta venga visualizzata UNA volta a sx e più grande: nella forma attuale non si vede bene l'immagine, che risulta troppo piccola. Se poi se ne trovasse una con il logo wp ingrandito da una lente di ingrandimento sarebbe ottimo.
  • La presente pagina di discussione reca il titolo EGO (una sorta di {{titolo errato}}), poi un box titolato anch'esso EGO, in cui trovo scritto Questo è il bar tematico del progetto Elenchi generati offline. Ma questa è un'informazione fuorviante, visto che wp:ego non è un progetto. --pequod ..Ħƕ 15:18, 9 lug 2012 (CEST)[rispondi]
D'accordo con te, comunque trovo molto fastidioso ripetere il template di navigazione in ogni singolo elenco. Come se ripetessimo il Template:Paginecancellare in ogni singola PDC. Basta e avanza il {{EGO}} --Bultro (m) 15:24, 9 lug 2012 (CEST)[rispondi]
Ehm, no. Attualmente {{TestataEGO}} è ripetuto negli elenchi più importanti (quelli di comprovato interesse generale e sempre da aggiornare) e non in tutti. È opportuno differenziare gli elenchi, anche attraverso il tmp di testata: il lettore (che in questo caso non è novizio se passa di qui...) così sa immediatamente quello che è di interesse (e forse si dà da fare) per i collegamenti rotti, le categorie che si autoincludono ecc.--Nickanc ♪♫@ 15:39, 9 lug 2012 (CEST)[rispondi]
Nel mentre ho trovato questa immagine. Si intitola Wikipedia Checkuser.svg: la copiamo con nuovo titolo e usiamo una copia? --pequod ..Ħƕ 15:58, 9 lug 2012 (CEST)[rispondi]
Sull'inserimento di TestataEGO nelle query più importanti concordo con Bultro e cmq penso che inserimenti seriali di questo genere vadano sempre discussi prima. --pequod ..Ħƕ 16:00, 9 lug 2012 (CEST)[rispondi]
Seriali??? Sicuro? Sta in cinque elenchi, le altre pagine dove sta sono pagine di spiegazione. Poi, non siamo un politburo, cui dobbiamo fare richieste preventive per tutto; se le cose non vanno bene, si discute, si annulla, si rifà.--Nickanc ♪♫@ 11:23, 10 lug 2012 (CEST)[rispondi]
Ah, pardon, pensavo fossero di più. E cmq la mia osservazione non era intesa ai fini degli splendori di un politburo, ma solo per evitare di fare e disfare. Se si trattava solo di cinque situescions, comunque, non hai fatto male ad essere bold. --pequod ..Ħƕ 12:35, 10 lug 2012 (CEST)[rispondi]

(rientro) Rimane credo la questione immagine sollevata da Pequod. Non mi formalizzo sul cambiamento: ho messo quell'immagien delle scartoffie copiando en.wiki, però possiamo sceglierne un'altra. È pur vero che il linguaggio dei simboli dice molto e che la lente d'ingrandimento su Wikipedia è un tradizionale simbolo dei CU, però se va bene usarla lo stesso, non mi faccio problemi assolutamente su di essa. Opinioni sull'immagine da mettere?--Nickanc ♪♫@ 18:33, 11 lug 2012 (CEST)[rispondi]

Nel mentre, per favore, puoi risolvere la faccenda di Discussioni Wikipedia:Elenchi generati offline/Testata ({{Struttura progetto/Bar tematico|Titolo = EGO}})? Insomma, togliere quel fastidioso EGO, EGO. Per l'immagine, mi sono permesso di proporre questa (nell'oggetto dell'edit c'è anche la richiesta di ricollocare l'immagine, usandola una volta, come detto). --pequod ..Ħƕ 03:33, 21 lug 2012 (CEST)[rispondi]

Elenco di stub che potrebbero non essere tali

Segnalo. --pequod ..Ħƕ 16:53, 11 lug 2012 (CEST)[rispondi]

Voci con interlinlk

Non serve ancora, ma è possibile avere un elenco di voci con interlink? --ValterVB (msg) 20:30, 2 mar 2013 (CET)[rispondi]

Sì, è possibile, ma considera che questo genere di elenchi sono retrodatati all'ultimo dump disponibile (per esempio oggi otterresti un elenco riferito al 22 febbraio). --Incola (posta) 16:19, 3 mar 2013 (CET)[rispondi]

Rinominare le "pagine meno recenti"

Che ne dite se spostassimo Wikipedia:Elenchi generati offline/Pagine meno recenti a Wikipedia:Elenchi generati offline/Voci non editate da più tempo? --pequod ..Ħƕ 01:55, 29 mag 2013 (CEST)[rispondi]

Sono d'accordo, il nuovo titolo è più descrittivo del precedente. --Incola (posta) 20:40, 29 mag 2013 (CEST)[rispondi]
Decisamente d'accordo. --Manfre87 (msg)
correttissimo.--Alexmar983 (msg) 11:45, 30 mag 2013 (CEST)[rispondi]
Sì, molto meglio. --AlessioMela (msg) 12:21, 30 mag 2013 (CEST)[rispondi]

voci più lunghe

avevo trovato l'ego delle voci più lunghe in kb ma non riesco a ritrovarlo mi sapete aiutare?--95.234.180.12 (msg) 15:02, 11 giu 2013 (CEST)[rispondi]

C'è la pagina speciale che però non so a quando risalga. Io mi ero fatta fare quello della voci più editate, Incola me ne ha fornito solo alcune però. --Elitre 16:54, 12 giu 2013 (CEST)[rispondi]
La pagina speciale è aggiornata. Se vi interessano tutte le voci con più edit che avevo trovato, questa è la lista completa (pensavo volessi sapere solo quella con più edit in assoluto). --Incola (posta) 17:31, 12 giu 2013 (CEST)[rispondi]


Progetto Lists su Labs

Ho creato il progetto lists su Wikimedia Labs. L'obiettivo del progetto è creare un sistema per rendere facile creare, gestire e consultare liste di pagine. Al momento supporto solo le Query (in futuro arriveranno anche gli script python e magari altre forme ;)). I vantaggi di questo approccio sono:

  1. Liste sempre aggiornate (automaticamente, senza bisogno di intervententi manuali)
  2. Minimo tempo impiegato nella creazione delle liste (le query che ho importato fino ad ora prendono in media 0~2 secondi l'una, e mai più di 10 secondi)
  3. Non-riempimento del db di wiki

Al momento sto portando le query più "facili" (il WMF ToolLabs non è ancora completo e alcune query non possono essere eseguite al momento). Il codice sorgente è open e recuperabile sul git di WMF. Fale (msg) 15:26, 26 giu 2013 (CEST)[rispondi]

Mi sembra un'idea fantastica! Non credo che però le query che necessitano di una ricerca all'interno del testo delle pagine possano essere eseguite dal ToolLabs. Visto che alcune query danno un gran numero di risultati, in una versione futura sarà possibile dividerli in più pagine come negli elenchi generati automaticamente da MediaWiki? Quando la maggioranza delle query saranno trasferite sul ToolLabs, queste pagine andranno riviste ed alleggerite visto che conterranno solo un link alla versione corrente dell'elenco. Ancora complimenti per l'idea. --Incola (posta) 18:06, 2 lug 2013 (CEST)[rispondi]
Bello, ma funzionerà a lungo termine anche in tua assenza?
In caso affermativo andrebbe pubblicizzato inserendo link diretti agli elenchi nelle pagine di servizio correlate, ad esempio quelli riguardanti le categorie in progetto:Categorie --Bultro (m) 14:38, 3 lug 2013 (CEST)[rispondi]
@Incola: Effettivamente quello che affermi è vero. Sto già lavorando per permettere anche l'esecuzione di script python che parsano il dump per questa evenienza
@Bultro: Assolutamente si: gli script sono tutti crontabbati (quindi si auto-eseguono) e il ToolLabs permette di avere più gestori per lo stesso progetto, quindi se altri utenti ToolLabs si fanno avanti, li posso accettare nel progetto e così ogniuno di noi diventa completamente intercambiabile per eventuali aggiunte e miglioramenti di query e del codice. Fale (msg) 12:50, 4 lug 2013 (CEST)[rispondi]