La Wayback Machine è la parte più popolare del sito Web di Internet Archive . Introdotto per la prima volta nel 2001, lo strumento online gratuito ti consente di tornare "indietro nel tempo" per vedere come apparivano i siti Web di tutto il mondo in determinati momenti. The Wayback Machine dispone di 562 miliardi di pagine Web al momento della stesura di questo articolo, con molte altre aggiunte ogni anno.
Ecco uno sguardo alla Wayback Machine e cosa la rende speciale.
Introduzione all'archivio Internet
Creato da Brewster Kahle e Bruce Gilliat, Internet Archive è un'organizzazione senza scopo di lucro con una missione dichiarata di "accesso universale a tutta la conoscenza". Fin dall'inizio, l'organizzazione ha fornito libero accesso pubblico a materiali digitalizzati, come pagine web, libri, registrazioni audio, inclusi concerti dal vivo, video, immagini e programmi software.
Ad oggi, tutto quanto raccolto da Internet Archive occupa più di 70 Petabyte di spazio sul server, comprese due copie del tutto. L'organizzazione è finanziata attraverso donazioni, sovvenzioni e commissioni dai servizi di digitalizzazione dei libri. Per motivi di privacy, Internet Archive non tiene traccia degli indirizzi IP dei suoi lettori e utilizza il protocollo HTTPS (sicuro) dappertutto.
La macchina del ritorno
Solo una parte di Internet Archive, la Wayback Machine, è stata progettata per acquisire il contenuto del sito Web che è stato modificato o rimosso. Dal lancio, è diventato uno dei luoghi più popolari e riconosciuti sul web. Kahle e Gilliat hanno chiamato il sito in onore del dispositivo immaginario per viaggiare nel tempo nella serie animata degli anni '60, The Rocky and Bullwinkle Show.
Sebbene Internet Archive non abbia lanciato il sito al pubblico fino all'ottobre 2001, Wayback Machine ha iniziato ad archiviare pagine Web memorizzate nella cache a partire da maggio 1996. Fino al 2001, i nastri digitali memorizzavano informazioni accessibili solo a scienziati e ricercatori selezionati. Quando tutto divenne pubblico cinque anni dopo (come da tempo pianificato), conteneva già oltre 10 miliardi di pagine archiviate.
Archiviazione e raccolte
Oggi il sito conserva i dati web storici su un cluster di nodi Linux. La Wayback Machine scarica tutte le informazioni pubblicamente accessibili e i file di dati sulle pagine Web attraverso il suo meccanismo di scansione. Tuttavia, non tutto ciò che viene pubblicato su un sito Web è incluso qui poiché alcuni contenuti sono limitati o archiviati in database, che non sono accessibili. Per questo motivo, alcuni siti Web vengono scansionati meglio di altri, a seconda di come gli sviluppatori hanno creato un sito alla volta.
Noterai anche che più nuovo è l'archivio, maggiore è il contenuto disponibile per un determinato sito. Un nuovo strumento introdotto da Internet Archive nel 2005 è uno dei motivi per cui i dati più recenti sono più completi. Archive-It.org aiuta a superare le incongruenze nei siti Web parzialmente memorizzati nella cache consentendo alle istituzioni e ai creatori di contenuti di raccogliere e conservare raccolte di contenuti digitali.
A proposito di scansione
I web crawler, a volte chiamati spider o spiderbot, sono vecchi quanto Internet stesso. Questi crawler sono bot Internet che navigano continuamente sul Web a scopo di indicizzazione, rendendoli un componente importante di qualsiasi motore di ricerca moderno. I crawler utilizzati dalla Wayback Machine per creare istantanee digitali di siti Web provengono da varie fonti, che sono cambiate nel tempo.
Come noterai rapidamente, la frequenza delle acquisizioni di istantanee varia notevolmente in base al sito Web. In genere, più grande (e forse più popolare) è un sito Web, maggiore sarà la scansione. Inoltre, molto dipende dalla frequenza con cui un sito Web cambia pagina. Anche i siti Web più piccoli vengono alla fine sottoposti a scansione a meno che non ci sia una ragione per cui non lo sono. Ad esempio, i siti protetti da password non vengono sottoposti a scansione e nemmeno i siti Web i cui proprietari di siti hanno richiesto di non essere inclusi.
Usando la Wayback Machine
Il sito Web Wayback Machine è facile da usare per chiunque. Per trovare le istantanee storiche di un sito Web, digita il suo nome nel motore di ricerca del sito. Nella pagina dei risultati della ricerca, i collegamenti ipertestuali indicano le date e gli orari in cui un sito è stato archiviato. Clicca sul link per vedere il sito “indietro nel tempo”.
Negli esempi seguenti, puoi vedere la prima pagina del sito Web di Apple registrata nel febbraio 2005 e nel novembre 2014 e la home page della CNN da una data nel marzo 2004 e nel settembre 2010.
Nota: queste scansioni includono anche collegamenti ad altre pagine registrate nelle date indicate, non solo alle home page.
Strumenti avanzati
Creata sia per i ricercatori che per il pubblico, Wayback Machine ha alcuni strumenti integrati che potrebbero mancare agli utenti occasionali. Ad esempio, in base alla progettazione, le pagine dei risultati di ricerca sono facili da consultare. Come spiegato, “Se trovi una pagina archiviata a cui vorresti fare riferimento sulla tua pagina Web o in un articolo, puoi copiare l'URL. Puoi anche utilizzare la corrispondenza fuzzy degli URL e la specifica della data... ma è un po' più avanzato".
Wayback Machine consente inoltre ai proprietari di siti di utilizzare una funzione "Salva pagina ora" per salvare una pagina specifica. Eppure, non è perfetto. Attualmente, la funzione non aggiunge l'URL del sito a scansioni future. Inoltre, la richiesta non salva più di una pagina. Tuttavia, è un buon primo passo per archiviare la home page del tuo sito web per il record storico.
Non è necessario visitare la Wayback Machine ogni volta per eseguire una nuova ricerca. Invece, puoi trovare il contenuto digitando l'indirizzo nella barra degli strumenti del tuo browser web. Utilizza questo formato per tutte le ricerche: https://web.archive.org/*/www.yoursite.com/*. Ad esempio, usa https://web.archive.org/*/www.groovypost.com/* per trovare le pagine archiviate per i Luckytemplates!
Strumenti mobili e per sviluppatori
Infine, Wayback Machine non si trova solo attraverso il web. Puoi trovare un'app Wayback Machine per iOS e Android . Ci sono anche estensioni per Chrome, Safari e Firefox. Gli sviluppatori vorranno anche controllare le API Internet Archive Wayback Machine. Questi rendono più facile per gli sviluppatori recuperare informazioni sui dati di acquisizione Wayback.
Internet Archive Wayback Machine supporta diverse API. In questo modo, è più facile per gli sviluppatori recuperare informazioni sui dati di acquisizione Wayback.
Andare "indietro nel tempo" per i tuoi siti Web preferiti è il motivo n. 1 per visitare Wayback Machine. È anche un ottimo strumento per chiunque cerchi la cronologia del sito Web per progetti scolastici o per uso aziendale. Qualunque cosa tu faccia, visita la Wayback Machine e guarda cosa puoi scoprire in pochi semplici passaggi.
Per ulteriori informazioni sul servizio di abbonamento Archive-It di Internet Archive, visita il sito Web ufficiale e inizia a contribuire oggi stesso!