Wikipedia:Bar/Discussioni/Spam-blacklist, e come questa viene aggirata

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Spam-blacklist, e come questa viene aggirata


Ieri nella talk della blacklist un utente protestava per la presenza di un link nella blacklist. Gli spiego che quando un sito viene spammato o è causa di link war finisce in blacklist. Nella sua risposta di oggi mi dice che ha aggirato la cosa sfruttando http://www.webcitation.org, ovvero un sito che permette di mostrare una copia esatta di una sito senza citarlo nell'URL.

Tento di orfanizzare questo sito per poi mettere anche lui in blacklist, e scopro che è usato più di 2000 volte in giro per tutta wiki!

Mi chiedo, non sarebbe meglio blacklistarlo (insieme agli altri siti simili) per evitare che la nostra blacklist diventi una barzelletta? I link che ci sono adesso possono essere trasformati nel vero link alla pagina che serve, ammesso che non sia proprio in blacklist Jalo 09:04, 5 apr 2012 (CEST)[rispondi]

come non esser d'accordo?.--Hal8999 (msg) 09:16, 5 apr 2012 (CEST)[rispondi]
Come tutti i siti di URL shortening! --Luckyz (msg) 09:25, 5 apr 2012 (CEST)[rispondi]
Il problema è l'suo che se ne fa. Webcitation, come Internet Archive, permette di linkare pagine web archiviate. Naturalmente il servizio è utile, io stesso ho usato webarchive svariate volte: basti vedere i primi link, che sono tutti di geocities, sito ormai non più esistente. Mi pare di aver capito che il formato dell'url è http://www.webcitation.org/query?url=NOMESITO ARCHIVIATO+altri valori quindi chiedo se non sia possibile blacklistare solo nel formato http://www.webcitation.org/query?url=URL BLACKLISTATO in modo da garantire ancora un uso lecito di questo servizio. --DelforT (msg) 09:28, 5 apr 2012 (CEST)[rispondi]
Hai capito male, il formato è invece simile a un URL shortener: http://www.webcitation.org/65YhgGPwt. --noi 09:35, 5 apr 2012 (CEST)[rispondi]
Però dal Cerca:Collegamenti risultano circa 500 link nel formato che ho indicato (esempio voce Nikos Galis). --DelforT (msg) 09:41, 5 apr 2012 (CEST)[rispondi]
Webcitation è un sito di archiviazione di pagine web su richiesta (non semplicemente di shortening), permette di citare un sito sia citandolo mediante un url abbreviato, sia mediante un url esteso come quello di webarchive. Tra l'altro la debolezza indicata si applicherebbe anche a siti archiviati da web archive.--Moroboshi scrivimi 10:03, 5 apr 2012 (CEST)[rispondi]
La differenza è che per webarchive bisogna specificare nell'url il nome del sito web che si vuole, per cui la blacklist funziona. Webcitation invece rende la cosa anonima, ed è questo il problema Jalo 10:09, 5 apr 2012 (CEST)[rispondi]
Non so se possibile, ma si potrebbe blacklistare solo i link abbreviati (come suggerisce DelforT) - il servizio che offre è molto comodo come archiviazione preempitiva per pagine che si teme in futuro scompaiano (dato che l'archiviazione è su richiesta e non casuale come web archive).--Moroboshi scrivimi 10:18, 5 apr 2012 (CEST)[rispondi]

@noi: DelforT non ha capito male, webcitation permette di citare i link archiviati in due formati diversi, uno abbreviato (http://www.webcitation.org/<codice abbreviato>) e l'altro per esteso (http://www.webcitation.org/ ARCHIVIATO+altri valori) che comprende l'url del sito citato, sta a chi fa la citazione di scegliere uno o l'altro formato, ma sono entrambi validi e funzionanti. --Moroboshi scrivimi 10:30, 5 apr 2012 (CEST)[rispondi]

Si, tecnicamente dovrebbe essere possibile bloccare solo quelli abbreviati. Direi quindi, se tutti sono d'accordo di operare proprio in questo senso. Blocchiamo quelli con formato abbreviato, sostituendo gli abbreviati "leciti" con un link diretto al sito, o mettendoli in whitelist quando il sito non è più esistente Jalo 10:32, 5 apr 2012 (CEST)[rispondi]
A Jalo nn ne sfugge una :)) --Sailko 14:57, 5 apr 2012 (CEST)[rispondi]
Concordo, ma in alcuni casi sarà necessario anche se esistenti, per esempio il dominio potrebbe essere stato ceduto a un'altra società (e quindi i contenuti e i contenuti cambiare completamente--Moroboshi scrivimi 15:14, 5 apr 2012 (CEST)[rispondi]
Jalo: a volte si sono salvate pagine "in abbreviato" che non esistono più nel sito originale ma che servono per fornire alle voci una fonte esterna affidabile ma purtroppo effimera, come questa. Che si fa in questi casi? --Pracchia 78 (scrivimi) 22:50, 5 apr 2012 (CEST)[rispondi]
Mi sembra anzi un sito (anche se per il momento ho capito solo a grandi linee a cosa serva e come funzioni) che potrebbe essere utile a combattere il link rot (su wikipedia inglese en:Link rot e anche en:Wikipedia:Link rot . E guardando en:WebCite ho scoperto che c'è anche en:Wikipedia:Using WebCite).
Il problema, come spesso accade non è il sito in sé, ma dipende da perché, come e a cosa esattamente si linka qui su Wikipedia. Del resto non blacklistiamo neppure Youtube, Facebook, ecc. ecc. che como noto hanno usi molto ... ehm ... vari --188.10.29.174 (msg) 00:57, 6 apr 2012 (CEST)[rispondi]
Per la questione pagine salvate "in abbreviato" posta da Pracchia 78: Ma per ogni pagina archiviata su quel sito, come quella portata ad esempio, quel sito ha sia l'url "normale" che quella "abbreviata"? --188.10.29.174 (msg) 01:01, 6 apr 2012 (CEST)[rispondi]
Legendo la documentazione sì, e per i siti che finora ho archiviato ho sempre ricevuto un'email con sia il link breve che quello lungo. In teoria il sito indicato da Pracchia-78 dovrebbe essere anche raggiungibile a http://www.webcitation.org/query?url=http://www.astrosurf.com/eaon/phenomenon%20rare.htm ma in pratica non funziona.--Moroboshi scrivimi 06:58, 6 apr 2012 (CEST)[rispondi]

Non ho studiato bene la questione, ma perché non blacklistare tutti gli ?id=... in modo tale da rendere possibile linkare i link rotti leciti usando webcitation col nome completo, ma non i siti blacklistati? Tecnicamente credo sia fattibile, no?--Sandro_bt (scrivimi) 01:50, 6 apr 2012 (CEST)[rispondi]

Si ma, come diceva moroboshi, alcuni link completi non funzionano. Quando si accede ad una pagina col nome breve appare comunque in alto l'url reale del sito mostrato. Non so se esiste modo di far girare un bot che controlli tutte le occorrenze di webcitation, e che dica quali di queste mostrano siti in BL Jalo 08:47, 6 apr 2012 (CEST)[rispondi]
Boh, potrebbe essere un bug del sito. (Ci si potrebbe informare dai gestori del sito -e informarli :-) - se si ritenesse che un simile inserimento in blacklist possa essere utile).
Piuttosto però io cercherei prima di capire quanto sia importante il problema di quel sito, e quindi se blacklistarlo e in che modo (ad es. nel primo messaggio si dice che tale sito è usato più di 2000 volte in tutta wiki, ma togliendo i casi legittimi e magari anche utili perché il sito originale non c'è più, quanti ce ne sono stati di ... molesti?). Come dicevo prima, attualmente non blacklistiamo siti ben più noti, ben più a rischio spam, e ben più a rischio di link a contenuti inadatti, illegali, in violazione di copyright, ecc. ecc. --87.0.136.78 (msg) 23:18, 6 apr 2012 (CEST)[rispondi]
E altra questione che presumo sia più importante e grave è quella esemplificata da Wikipedia:Bar/Discussioni/Problema link fine pagina: League of legends, l'inserimento di un indirizzo indirizzo a referral per far "guadagnare" ad un utente del sito linkato (magari con successiva edit war tra tali utenti per avere lo .., sfruttamento di tale link). --188.10.29.42 (msg) 00:04, 8 apr 2012 (CEST)[rispondi]