Discussioni Wikipedia:Elenchi generati offline/Collegamenti esterni/Domini frequenti

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Grazie al lavoro del buon Incola è stata finalmente aggiornata la lista dei siti esterni più linkati da wikipedia che avevo richiesto nel 2011 ed era ferma ormai da sette anni! Sfortunatamente a quanto pare non è possibile col tool di wiki dividerli per namespace (almeno non tramite una semplice variabile, si può semmai fare successivamente con un bot, se la cosa interessasse). Lo segnalo al bar perchè si tratta di un'interessante ricerca per evidenziare eventuali spammosità su grande scala o comunque abusi/eccessi. Interlex.it, tanto per fare un esempio, è un "falso positivo", infatti è così tanto linkato poiché è l'unico sito ad avere una versione aggiornata della legge sul diritto d'autore (ed è quindi linkato sostanzialmente in tutte le pagine delle immagini, o quasi; quando o se si trovasse una versione "istituzionale" della legge il link sarebbe da sostituire). Restano comunque vari casi da analizzare e si tratta di un'interessante informazione sulla quale discutere per utenti, patroller, admin o anche semplici curiosi. Ad maiora. :) --Lucas 04:44, 9 giu 2013 (CEST)[rispondi]

(fuori crono) (OT) Ma la versione ufficiale delle leggi non dovrebbe essere su normattiva? --Cpaolo79 (msg) 10:17, 9 giu 2013 (CEST) [rispondi]
(fuori crono) (OT) Eh già, peccato che la legge sia del 1941 (così come moltre altre pre-repubblica), e quindi una versione consolidata non esiste su quel sito. Ce n'era una online sul sito della SIAE, ma non aggiornata né legalmente valida, quella su interlex, a quanto mi risulta, è la più affidabile e aggionrata... --Lucas 10:38, 9 giu 2013 (CEST)[rispondi]
(fuori crono) (OT) Fantastico: e pensare che il D.Lgs. 33/2013 obbliga le pubbliche amministrazioni a linkare Normattiva quando si cita una legge :-D. --Cpaolo79 (msg) 10:54, 9 giu 2013 (CEST) [rispondi]
Interessante! A quanto pare c'è da fare una bella pulizia di wikilink a it.wiki e alle altre versioni straniere. Bot? --Sailko 08:29, 9 giu 2013 (CEST)[rispondi]
Ottimo può essere davvero utile! --Erik91☆☆☆ +1 (40mila edit sotto la Mole) 09:52, 9 giu 2013 (CEST)[rispondi]
è normale che ci siano 3585 link ad un indirizzo IP? il sito della Lega A di Basket non ha un dominio? ("www.legabasket.it" sembra portare allo stesso sito). a me preoccupa inoltre il 13esimo posto di Google Libri (temo molti siano link a snippet) anche se, in assenza di divisione tra ns, è impossibile capire se i link a Google o ai vari progetti Wikimedia siano semplicemente url lasciati nelle discussioni o siano effettivamente un problema presente in numerose voci. --valepert 10:19, 9 giu 2013 (CEST)[rispondi]
(f.c.) per quanto riguarda il template sulla Lega Basket: fatto. --DelforT (msg) 15:31, 9 giu 2013 (CEST)[rispondi]
Volendo posso rigenerare l'elenco considerando solo i collegamenti presenti in voci del ns0. La pagina Speciale:CercaCollegamenti continuerà a elencare tutte le occorrenze senza distinzioni di namespace, ma la "classifica" considererà solo i link del ns0. --Incola (posta) 11:50, 9 giu 2013 (CEST)[rispondi]
Sarebbe ottimo, si potrebbe dare una pulita, ad esempio, a tutte le voci che usano link a wikipedia nelle note come fossero fonti.--151.67.221.19 (msg) 12:20, 9 giu 2013 (CEST)[rispondi]
✔ Fatto, ho aggiornato l'elenco. --Incola (posta) 13:10, 9 giu 2013 (CEST)[rispondi]
a caldo faccio notare che i link a freenode, en.wiki, it.wiki e Google sono spariti dalle prime posizioni, i link a Google Books sono ancora numerosi (ottavo e quattordicesimo posto), mentre da lato social Facebook è addirittura dietro MySpace. --valepert 13:24, 9 giu 2013 (CEST)[rispondi]

[ Rientro] Qualche impressione a caldo anche da parte mia: quei quasi quattordicimila link a youtube (tra youtube e it.youtube) nascondono molto probabilmente una serie infinita di violazioni di copyright. Quei duemila link a facebook molto probabilmente contengono un bel po' di link fuori dalle linee guida. Il resto va guardato per benino. --Lucas 14:28, 9 giu 2013 (CEST)[rispondi]

Ma su You Tube ci sono anche link del tutto legittimi che puntano o a materiale in pubblico dominio o ai canali ufficiali, quindi a materiale ampiamente autorizzato. Molta attenzione ma no deciso a interventi indiscriminati a tappeto.--Cotton Segnali di fumo 15:27, 9 giu 2013 (CEST)[rispondi]
P.S. Se ci fosse ancora il template Mvideo, cancellato con un blitz di tipo ideologico qualche anno fa sono certo non avremmo nemeno la metà di questo problema.
Ué, mica ho parlato di sparatorie o interventi indiscriminati :). Ho detto che su quei 14.000 link molto probabilmente c'è una serie infinita di documenti in violazione copyright. Temo sarà difficile smentire questa affermazione, ma sarei felicissimo se fosse così! --Lucas 15:41, 9 giu 2013 (CEST)[rispondi]
(fuori cron) @Cotton: sul P.S. devo ricordare che l'esistenza del template Mvideo non influisce sul numero di link presenti nell'EGO. si confronti ad esempio con l'uso del {{dmoz}}. --valepert 15:48, 9 giu 2013 (CEST)[rispondi]
Influisce e come: al posto di migliaia di link diretti in violazione di copyright ci sarebbe lui che non le è. --Cotton Segnali di fumo 17:11, 9 giu 2013 (CEST)[rispondi]

(ri-rientro) Sempre sulla base dei dati del prezioso Incola - e sempre riferendosi solo al ns0 - se volessimo allargare la lista a tutti i domini con 50 link in ingresso sarebbero 3915, con 25 sarebbero 7601 e con 10 sarebbero 18617. Credete possa essere utile allargare la lista? --Lucas 14:39, 9 giu 2013 (CEST)[rispondi]

@Cotton non capisco come l'uso del template mvideo limiterebbe il link a materiale non concesso su youtube, che lo linki attraverso un template che direttamente sempre materiale non ammesso rimane. @Delfort sull'uso dei link a googlebooks c'è una discussione in corso Wikipedia:Bar/Discussioni/Quando mettere i link a Google Books?.--Moroboshi scrivimi 18:58, 9 giu 2013 (CEST)[rispondi]
E' molto semplice. Il template non linkava direttamente nulla ma si limitava ad un'operazione del tutto lecita ovvero attivare una ricerca su You Tube con il titolo della voce, in pratica equivaleva a consigliare di cercare se ci fossero contenuti su uno dei portali più celebri del mondo, operazione ben lungi da costituire violazione di copyright. I link diretti se puntano direttamente a contenuti vietati rappresentano invece una violazione: tolta senza motivi concreti l'opzione lecita è ovvio che quella illecita sia aumentata e non poco.--Cotton Segnali di fumo 21:44, 9 giu 2013 (CEST)[rispondi]
Chiedo scusa ma i link devono essere puntuali e si conoscere a che cosa cosa punta, un link al titolo si beccherà un sacco di falsi positivi e non servirebbe assolutamente a nulla - quando si linka una fonte si deve sapere che cosa si collega, non sparare alla cieca.--Moroboshi scrivimi 21:52, 9 giu 2013 (CEST)[rispondi]
Certo, ma di migliaia e migliaia di link, quelli usati come fonti sono solo una parte. Se vai a ripulire vedrai che un gran numero si trovano tra i collegamenti esterni e quelli erano tutti evitati (o evitabili) grazie al template. --Cotton Segnali di fumo 22:09, 9 giu 2013 (CEST)[rispondi]
Occasionalmente il giro di ricerca con youtube me lo faccio (ed elimino solo quelli a link non ufficiali o non più funzionanti, non vado indiscriminatamente) e quindi ho presente la situazione dei link esterni. Ma continuo a ritenere inutile un template che spari a caso - anche i link nei collegamenti esterni devono essere ragionati e non inseriti a casaccio fidandosi di una chiave di ricerca e dell'algoritmo di ricerca di un sito.--Moroboshi scrivimi 22:26, 9 giu 2013 (CEST)[rispondi]

Che ci fanno 200000 link a toolserver in ns-zero? --Retaggio (msg) 11:31, 10 giu 2013 (CEST)[rispondi]

Suppongo opera del {{Coord}}.--Moroboshi scrivimi 11:39, 10 giu 2013 (CEST)[rispondi]

Scusate se cambio argomento dalle domande puntuai ma io pensavo a vari strumenti:

1) un bot che trasformasse i link "esterni" impropri a un'altra wiki/questa wiki in link dalla "giusta" sintassi fra doppie parentesi quadre. Un po' lezioso, ma penso che sarebbe utile, per esempio in ambito wiki il "puntano qui" serve infatti anche a recuperare le disucssioni progresse su un argomento;
2) un bel festival della qualità di ripuliture dei link, che porti a individuare alcuni link critici per varie questioni (p.e. youtube causa copyright) e a rimuoverli, sensibilizzando i progetti e i lavorosporchisti;
3) Eventualmente anche un festival (stesso o altro) che si occupi di individuare alcuni link di "fornitori di contenuti" (giornali, riviste...) che oltre a essere frequentemente usati, sono anche potenzialemnte enciclopedici. Aiuterebbe a individuare le nuove voci da fare del progetto:editoria. Sarei lieto di standardizzarne i link rossi in ingresso, e di farne le più rilevanti che siano, contemporaneamente, da contestualizzare nell'interesse del lettore in quanto molto citati nelle nostre bibliografie.

Gli stessi festival una volta ridotto l'elenco potrebbero essere riproposti negli anni successivi scendendo a un dettaglio "maggiore", individuando anche gli inserimenti spam più evidenti.--Alexmar983 (msg) 22:22, 12 giu 2013 (CEST)[rispondi]

Per punti:
  1. Una parte dei link "esterni-interni" potrebbe derivare da link a pagine con differenze di cronologia o vecchie versioni, come questo o questo, che non si possono rendere diversamente (ma che non mi viene in mente come potrebbero essere presenti in pagine del namespace principale!), quindi bisognerebbe pensarci, certo le pagine sarebbero da analizzare (magari una sottopagina sempre fatta da un bot linki tutte quelle in ns0!)!
  2. Condivido al massimo! Ci sono certamente moltissime cose da sistemare (fonti scadenti/illegali, link rotti, decidere il da farsi con googlebooks), potrebbe essere una buona occasione per fare una bella sistemata alle fonti (problema storico di it.wiki e che aiuterebbe a dare autorevolezza all'enciclopedia).
  3. Perchè no? A questi scopi, comunque, allargherei il limite dei link presenti e pongo quindi di nuovo la mia domanda::_
se volessimo allargare la lista a tutti i domini con almeno 50 link in ingresso sarebbero 3915, con 25 sarebbero 7601 e con 10 sarebbero 18617. Credete possa essere utile allargare la lista? A quanti? --Lucas 16:40, 14 giu 2013 (CEST)[rispondi]
ragionando in termini di festival: 5 utenti attivi (stima per difetto) x 30 giorni (stima per difetto) x 2 domini controllate al giorno (stima per difetto) = 300. Ovviamente è una cifra ridicolmente sottostimata, ma è evidente che al "primo giro" è meglio fermarsi a 3915. Dal momento che non è chiaro il carico di lavoro, meglio fare un test "leggero", nel peggiore dei casi finiremo prima. In alternativa facciamo comunque un EGO "leggero", lo teniamo in sottofondo per qualche mese accessibile agli "utenti esperti", studiandolo meglio e se le cose procedono spedite, e una parte del lavoro è già stata svolta, al momento dell'eventuale festival lo allarghiamo alla fascia 25-50.--Alexmar983 (msg) 22:18, 15 giu 2013 (CEST)[rispondi]