Wayback Machine to najpopularniejsza część witryny Internet Archive . Wprowadzone po raz pierwszy w 2001 roku bezpłatne narzędzie online pozwala cofnąć się w czasie, aby zobaczyć, jak wyglądały witryny na całym świecie w danym momencie. W chwili pisania tego tekstu Wayback Machine zawiera 562 miliardy stron internetowych, a każdego roku dodawanych jest o wiele więcej.
Oto spojrzenie na Wayback Machine i co czyni go wyjątkowym.
Wprowadzenie do archiwum internetowego
Stworzone przez Brewstera Kahle i Bruce'a Gilliata Internet Archive jest organizacją non-profit, której misją jest „powszechny dostęp do wszelkiej wiedzy”. Od samego początku organizacja zapewniała bezpłatny publiczny dostęp do zdigitalizowanych materiałów, takich jak strony internetowe, książki, nagrania audio, w tym koncerty na żywo, filmy, obrazy i programy komputerowe.
Do tej pory wszystko zebrane przez Internet Archive zajmuje ponad 70 petabajtów miejsca na serwerze, w tym dwie kopie wszystkiego. Organizacja jest finansowana z darowizn, dotacji i opłat z usług digitalizacji książek. Ze względu na prywatność, Internet Archive nie śledzi adresów IP swoich czytelników i używa całego protokołu HTTPS (bezpiecznego).
Maszyna Wayback
Tylko jedna część archiwum internetowego, Wayback Machine, została zaprojektowana do przechwytywania zawartości witryny, która została zmieniona lub usunięta. Od momentu uruchomienia stał się jednym z najpopularniejszych i najbardziej rozpoznawalnych miejsc w sieci. Kahle i Gilliat nazwali to miejsce na cześć fikcyjnego urządzenia do podróży w czasie z serialu animowanego z lat 60. The Rocky and Bullwinkle Show.
Chociaż Internet Archive nie udostępniło tej witryny publicznie do października 2001 r., Wayback Machine zaczął archiwizować strony internetowe z pamięci podręcznej od maja 1996 r. Do 2001 r. taśmy cyfrowe przechowywały informacje, które były dostępne tylko dla wybranych naukowców i badaczy. Kiedy pięć lat później wszystko ujrzało światło dzienne (co było od dawna zaplanowane), zawierało już ponad 10 miliardów zarchiwizowanych stron.
Przechowywanie i kolekcje
Obecnie witryna przechowuje historyczne dane sieciowe w klastrze węzłów Linux. Wayback Machine pobiera wszystkie publicznie dostępne informacje i pliki danych na stronach internetowych za pomocą mechanizmu indeksowania. Jednak nie wszystko publikowane na stronie jest tutaj uwzględnione, ponieważ niektóre treści są ograniczone lub przechowywane w niedostępnych bazach danych. Z tego powodu niektóre witryny są lepiej indeksowane niż inne, w zależności od tego, w jaki sposób programiści tworzyli witrynę w danym momencie.
Zauważysz również, że im nowsze archiwum, tym więcej treści jest dostępnych dla danej witryny. Nowe narzędzie, jakim jest Archiwum Internetowe wprowadzone w 2005 roku, jest jednym z powodów, dla których nowsze dane są bardziej kompletne. Archive-It.org pomaga przezwyciężyć niespójności w częściowo buforowanych witrynach internetowych, umożliwiając instytucjom i twórcom treści gromadzenie i przechowywanie kolekcji treści cyfrowych.
O indeksowaniu
Roboty indeksujące, czasami nazywane pająkami lub robotami pająka, są tak stare, jak sam internet. Te roboty to roboty internetowe, które stale przeglądają sieć w celu indeksowania, co czyni je ważnym elementem każdej nowoczesnej wyszukiwarki. Roboty wykorzystywane przez Wayback Machine do tworzenia cyfrowych migawek witryn internetowych pochodzą z różnych źródeł, które z czasem uległy zmianie.
Jak szybko zauważysz, częstotliwość przechwytywania migawek różni się znacznie w zależności od witryny. Zazwyczaj im większa (i być może bardziej popularna) witryna, tym częściej występuje indeksowanie. Poza tym wiele zależy od tego, jak często strona zmienia się na stronie. Nawet najmniejsze strony internetowe są ostatecznie indeksowane, chyba że istnieje powód, dla którego tak nie jest. Na przykład witryny chronione hasłem nie są indeksowane, podobnie jak witryny, których właściciele zażądali, aby nie były uwzględniane.
Korzystanie z Wayback Machine
Witryna Wayback Machine jest łatwa w użyciu dla każdego. Aby znaleźć historyczne migawki witryny, wpisz jej nazwę w wyszukiwarce witryny. Na stronie wyników wyszukiwania hiperłącza oznaczają daty i godziny archiwizacji witryny. Kliknij link, aby zobaczyć witrynę „z powrotem w czasie”.
W poniższych przykładach możesz zobaczyć stronę główną witryny Apple zarejestrowaną w lutym 2005 r. i listopadzie 2014 r. oraz stronę główną CNN z marca 2004 r. i września 2010 r.
Uwaga: te indeksowania obejmują również linki do innych stron zarejestrowanych w podanych dniach, nie tylko do stron głównych.
Zaawansowane narzędzia
Stworzony zarówno dla badaczy, jak i opinii publicznej, Wayback Machine ma kilka wbudowanych narzędzi, których zwykli użytkownicy mogą przegapić. Na przykład, zgodnie z projektem, strony wyników wyszukiwania są łatwe do odniesienia. Jak wyjaśniono: „Jeśli znajdziesz zarchiwizowaną stronę, do której chcesz się odnieść na swojej stronie internetowej lub w artykule, możesz skopiować adres URL. Możesz nawet użyć rozmytego dopasowywania adresów URL i specyfikacji daty… ale to trochę bardziej zaawansowane”.
Wayback Machine umożliwia również właścicielom witryn korzystanie z funkcji „Zapisz stronę teraz”, aby zapisać określoną stronę. A jednak nie jest idealny. Obecnie ta funkcja nie dodaje adresu URL witryny do żadnego przyszłego indeksowania. Dodatkowo żądanie nie zapisuje więcej niż jednej strony. Jednak dobrym pierwszym krokiem jest zarchiwizowanie strony głównej witryny w celu uzyskania danych historycznych.
Nie musisz za każdym razem odwiedzać Wayback Machine, aby przeprowadzić nowe wyszukiwanie. Zamiast tego możesz znaleźć zawartość, wpisując adres na pasku narzędzi przeglądarki internetowej. Użyj tego formatu dla wszystkich wyszukiwań: https://web.archive.org/*/www.yoursite.com/*. Na przykład użyj https://web.archive.org/*/www.groovypost.com/*, aby znaleźć zarchiwizowane strony Luckytemplates!
Narzędzia mobilne i programistyczne
Wreszcie, Wayback Machine nie znajduje się tylko w Internecie. Możesz znaleźć aplikację Wayback Machine na iOS i Androida . Istnieją również rozszerzenia dla Chrome, Safari i Firefox. Deweloperzy będą również chcieli sprawdzić interfejsy API Internet Archive Wayback Machine. Ułatwiają one programistom pobieranie informacji o danych przechwytywania Wayback.
Internet Archive Wayback Machine obsługuje kilka różnych interfejsów API. W ten sposób ułatwia programistom pobieranie informacji o danych przechwytywania Wayback.
Cofanie się w czasie do ulubionych stron internetowych to główny powód, dla którego warto odwiedzić Wayback Machine. Jest to również świetne narzędzie dla każdego, kto bada historię witryny do projektów szkolnych lub do użytku biznesowego. Cokolwiek robisz, odwiedź Wayback Machine i zobacz, co możesz odkryć w kilku prostych krokach.
Aby uzyskać więcej informacji na temat usługi subskrypcji Archive-It Archiwum Internetowego, odwiedź oficjalną stronę internetową i zacznij współtworzyć już dziś!