Wikipedia:Bar/Discussioni/Archive.today, archive.is

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Archive.today, archive.is


Archive.is fornisce un servizio di archiviazione di pagine web.
Da quanto si riesce a sapere il servizio è stato creato da un Wikipediano probabilmente ceco che ha iniziato a usarlo massicciamente su Wikipedia. Il problema è che, fallita una richiesta di autorizzazione bot su en.wiki, ha deciso che le richieste erano inutili e ha pensato bene di infischiarsene anche in tutto il resto del mondo Wikipediano.
Il bot, a parte su en.wiki, era rigorosamente "anonimo". Il bot e poi l'utente sono stati bloccati su svariate wiki, ma ciò non ha mica demoralizzato il nostro che ha continuato a inserire massicciamente il sito attraverso un sistema di anonimizzazione di altissima qualità a una velocità enorme e, per di più, avendo cura di inserire al massimo uno due link con lo stesso ip, in maniera tale da evitare revert a manetta.
Ancor peggio nel mentre ha cambiato struttura dei link: se prima i link avevano una struttura del tipo "archive.is/data/URLoriginale", perfettamente gestibile (e sostituibile) via bot, dopo questo bailamme la struttura è stranamente diventata del tipo "archive.is/codicecasuale": da quel momento la rimozione automatizzata del link è diventata impossibile.
Tempo fa il proprietario del sito ha registrato archive.today e ha ben pensato di sostituirlo/usarlo abbondantemente. Il problema è che la ditta che gestisce i .today ha sospeso il sito e, come se nulla fosse, l'autore è ripartito con le sostituzioni in massa. Tutta questa storia è costellata da un ventaglio di tentativi di ragionarci: l'ho bloccato globalmente, gli ho scritto, gli ho fatto terra bruciata di proxy, gli ho scritto, gli ho messo un filtro antiabusi che gli dava un messaggio.
Niente di niente di niente.
Il sito è stato sospeso perché è totalmente impermeabile a richieste di rimozione di contenuti protetti da diritto d'autore o soggetti a querela (e ci potrebbe pure stare per evitare la censura) e ignora bellamente i robots.txt.
In onestà non mi fido. Non mi fido a rendere essenziale un servizio con queste caratteristiche, che può venir meno da un momento all'altro e che ci viene sostanzialmente imposto da una singola persona.
Blacklistarlo è al momento impossibile. La mia idea è quindi quella di deprecarlo e sostituirlo lentamente, io nelle ultime settimane ho sostituito via bot (con archive.org) circa seicento link, ne rimangono altri 3.400, credo che a tempo perso li possiamo ridurre a quei 200 casi nei quali archive.org non basta.
:--Vito (msg) 22:38, 5 apr 2016 (CEST)[rispondi]

Confesso che non ne avevo mai sentito parlare. Con delle premesse del genere, raus!, senza dubbio. --Syrio posso aiutare? 23:45, 5 apr 2016 (CEST)[rispondi]
Conoscevo il servizio e sapevo che era bandito su en.wiki, ma non ho mai ben capito che posizione avessimo preso noi (presumo nessuna). Io di solito se mi imbatto in qualche link lo rimuovo o lo sostituisco. Mi sembra ragionevole bandirlo o quantomeno deprecarlo, al di là delle questioni procedurali, anche solo per la notevole quantità di materiale illegale che vi si trova. Visto che in generale l'argomento dell'archiviazione è troppo ignorato da queste parti, potrebbe essere l'occasione per scrivere una linea guida e/o una pagina d'aiuto sull'argomento (magari prendendo spunto da w:en:Help:Using the Wayback Machine e w:en:Wikipedia:Using WebCite). --Tino [...] 07:06, 6 apr 2016 (CEST)[rispondi]
[@ Vituzzu] Un chiarimento: è impossibile blacklistarlo perché ci sono collegamenti utili ad esso in giro, o per qualche altra ragione tecnica? --Tino [...] 07:08, 6 apr 2016 (CEST)[rispondi]
Celebre sito di archiviazione che ha un grande pregio che è anche il suo più grande difetto: se ne infischia di qualsiasi direttiva e mantiene l'archivio a propria assoluta discrezione. Ci si trovano varie cose rimosse dall'archive (anche perché l'archive segue la netiquette e quanto indicato nel robots) e pure oggetto di contenzioso. Quando diventerà più noto ci sarà probabilmente qualche causa legale che lo metterà in difficoltà, ma per ora se la cava. Non avevo notato questo "assalto promozionale", ma devo dire che non è una situazione semplice: alcune cose sono solo lì, ma certo non va bene una spammata di tale portata. Hmm... Direi che il sunto contenuto nella frase finale di Vito è quello più opportuno. --Lucas 08:44, 6 apr 2016 (CEST)[rispondi]
Come segnalato altrove, da sistemare le pagine di aiuto Aiuto:Collegamenti interrotti in primis--Shivanarayana (msg) 11:29, 6 apr 2016 (CEST)[rispondi]
Il sito in sé è utile, in particolare perché a volte riesce ad archiviare delle pagine laddove wayback machine fallisce (specie in presenza di molto JavaScript), quindi va certamente consentito il suo uso da parte degli utenti nelle voci. 93.54.88.218 (msg) 12:23, 6 apr 2016 (CEST)[rispondi]
Discussione vecchia, ma sempre attuale. Archive.is è l'unico servizio web che garantisce la preservazione digitale degli URL nel lungo termine. Nell'Internet Archive non è raro trovare URl che divengono non più disponibili perchpè il sito originale nonè più online, di fatto vanificando il salvataggio. Archive.is è vitale per Wikipedia che basa le sue voci su fonti esterne che devono restare permenenti e verificabili. Il sito è in sè neutrale, ospitando anche pagine Web salvati in violazioni di copyright: in ogni caso, sono risorse gratuitamente disponibili e non essite fine di lucro nè per il sito nè per chi li salva, assumendosene la responsabilità personale. Credo che questo fatto non interessi Wikipedia. Del resto, specialmente nelle biografie (sezione "controversie", ecc.), esiste un rischio di diffamazione o calunnia anche nel citare fonti, che poi si trasformano poi in link non funzionanti, o vengono modificate dagli autori senza la decenza di indicare nemmeno la data di prima pubblicazione e di ultima modifica. Fatto che a sua volta indica la serietà e la professionalità delle "fonti giornalistiche nazionali", che si presumono generalmente essere di migliore qualità per le voci di WP. Saluti, --Micheledisaveriosp (msg) 00:30, 17 nov 2019 (CET)[rispondi]