Die Wayback Machine ist der beliebteste Teil der Internet Archive - Website . Das 2001 erstmals eingeführte kostenlose Online-Tool lässt Sie „in der Zeit zurück“ reisen, um zu sehen, wie Websites zu bestimmten Zeiten weltweit aussahen. Zum Zeitpunkt des Schreibens dieses Artikels umfasst die Wayback Machine 562 Milliarden Webseiten, und jedes Jahr kommen viele weitere hinzu.
Hier ist ein Blick auf die Wayback Machine und was sie besonders macht.
Einführung in das Internetarchiv
Das von Brewster Kahle und Bruce Gilliat gegründete Internet Archive ist eine gemeinnützige Organisation mit der erklärten Mission des „universellen Zugangs zu allem Wissen“. Von Anfang an hat die Organisation kostenlosen öffentlichen Zugang zu digitalisierten Materialien wie Webseiten, Büchern, Audioaufnahmen, einschließlich Live-Konzerten, Videos, Bildern und Softwareprogrammen bereitgestellt.
Bis heute nimmt alles, was vom Internet Archive gesammelt wurde, mehr als 70 Petabyte Serverplatz ein, einschließlich zweier Kopien von allem. Die Organisation wird durch Spenden, Zuschüsse und Gebühren von Buchdigitalisierungsdiensten finanziert. Aus Datenschutzgründen verfolgt das Internetarchiv die IP-Adressen seiner Leser nicht und verwendet durchgehend das (sichere) HTTPS-Protokoll.
Die Wayback-Maschine
Nur ein Teil des Internetarchivs, die Wayback Machine, wurde entwickelt, um geänderte oder entfernte Website-Inhalte zu erfassen. Seit seiner Einführung hat es sich zu einem der beliebtesten und anerkanntesten Orte im Internet entwickelt. Kahle und Gilliat benannten die Website nach dem fiktiven Zeitreisegerät in der Zeichentrickserie The Rocky and Bullwinkle Show aus den 1960er Jahren.
Obwohl Internet Archive die Website erst im Oktober 2001 öffentlich zugänglich machte, begann die Wayback Machine ab Mai 1996 mit der Archivierung zwischengespeicherter Webseiten. Bis 2001 speicherten digitale Bänder Informationen, die nur ausgewählten Wissenschaftlern und Forschern zugänglich waren. Als alles fünf Jahre später (wie lange geplant) der Öffentlichkeit zugänglich gemacht wurde, enthielt es bereits über 10 Milliarden archivierte Seiten.
Lagerung und Sammlungen
Heute speichert die Site historische Webdaten auf einem Cluster von Linux-Knoten. Die Wayback Machine lädt alle öffentlich zugänglichen Informationen und Datendateien auf Webseiten über ihren Crawl-Mechanismus herunter. Allerdings ist hier nicht alles enthalten, was auf einer Website gepostet wird, da einige Inhalte eingeschränkt oder in Datenbanken gespeichert sind, auf die nicht zugegriffen werden kann. Aus diesem Grund werden einige Websites besser gecrawlt als andere, je nachdem, wie Entwickler jeweils eine Website erstellt haben.
Sie werden auch feststellen, je neuer das Archiv ist, desto mehr Inhalte sind für eine bestimmte Site verfügbar. Ein neues Tool, das Internet Archive, das 2005 eingeführt wurde, ist einer der Gründe, warum neuere Daten vollständiger sind. Archive-It.org hilft bei der Überwindung von Inkonsistenzen in teilweise zwischengespeicherten Websites, indem es Institutionen und Erstellern von Inhalten ermöglicht, Sammlungen digitaler Inhalte zu sammeln und aufzubewahren.
Über das Krabbeln
Webcrawler, manchmal auch Spider oder Spiderbot genannt, sind so alt wie das Internet selbst. Diese Crawler sind Internet-Bots, die das Web zu Indizierungszwecken kontinuierlich durchsuchen, was sie zu einem wichtigen Bestandteil jeder modernen Suchmaschine macht. Die Crawler, mit denen die Wayback Machine digitale Schnappschüsse von Webseiten erstellt, stammen aus verschiedenen Quellen, die sich im Laufe der Zeit verändert haben.
Wie Sie schnell feststellen werden, variiert die Häufigkeit von Schnappschüssen je nach Website stark. Je größer (und vielleicht beliebter) eine Website ist, desto mehr Crawling findet in der Regel statt. Außerdem hängt viel davon ab, wie oft eine Website Seitenwechsel aufweist. Selbst die kleinsten Websites werden schließlich gecrawlt, es sei denn, es gibt einen Grund, warum dies nicht der Fall ist. Beispielsweise werden passwortgeschützte Websites nicht gecrawlt, ebenso wie Websites, deren Website-Inhaber angefordert haben, dass sie nicht aufgenommen werden.
Verwendung der Wayback-Maschine
Die Wayback Machine-Website ist für jeden einfach zu bedienen. Um historische Momentaufnahmen einer Website zu finden, geben Sie ihren Namen in die Suchmaschine der Website ein. Auf der Suchergebnisseite geben Hyperlinks Daten und Zeiten an, zu denen eine Website archiviert wurde. Klicken Sie auf den Link, um die Seite „zurück in die Vergangenheit“ zu sehen.
In den folgenden Beispielen sehen Sie die Titelseite der Apple-Website, aufgezeichnet im Februar 2005 und November 2014, und die CNN-Homepage von einem Datum im März 2004 und September 2010.
Hinweis: Diese Crawls umfassen auch Links zu anderen Seiten, die an den angegebenen Daten aufgezeichnet wurden, nicht nur zu den Startseiten.
Erweiterte Tools
Die Wayback Machine wurde sowohl für Forscher als auch für die Öffentlichkeit entwickelt und verfügt über einige integrierte Tools, die Gelegenheitsbenutzer möglicherweise vermissen. Zum Beispiel sind Suchergebnisseiten einfach zu referenzieren. Wie erklärt: „Wenn Sie eine archivierte Seite finden, auf die Sie auf Ihrer Webseite oder in einem Artikel verweisen möchten, können Sie die URL kopieren. Sie können sogar Fuzzy-URL-Abgleich und Datumsangaben verwenden … aber das ist etwas fortgeschrittener.“
Die Wayback-Maschine ermöglicht es Websitebesitzern auch, eine Funktion „Seite jetzt speichern“ zu verwenden, um eine bestimmte Seite zu speichern. Und doch ist es nicht perfekt. Derzeit fügt die Funktion die Website-URL keinen zukünftigen Crawls hinzu. Darüber hinaus speichert die Anforderung nicht mehr als eine Seite. Es ist jedoch ein guter erster Schritt, die Homepage Ihrer Website für die historische Aufzeichnung zu archivieren.
Sie müssen nicht jedes Mal zur Wayback Machine gehen, um eine neue Suche durchzuführen. Stattdessen können Sie Inhalte finden, indem Sie die Adresse in die Symbolleiste Ihres Webbrowsers eingeben. Verwenden Sie dieses Format für alle Suchen: https://web.archive.org/*/www.yoursite.com/*. Verwenden Sie beispielsweise https://web.archive.org/*/www.groovypost.com/*, um archivierte Seiten für die Luckytemplates zu finden!
Mobil- und Entwicklertools
Schließlich ist die Wayback Machine nicht nur über das Internet zu finden. Sie können eine Wayback Machine-App für iOS und Android finden . Es gibt auch Erweiterungen für Chrome, Safari und Firefox. Entwickler sollten sich auch die Internet Archive Wayback Machine APIs ansehen. Diese erleichtern es Entwicklern, Informationen über Wayback-Erfassungsdaten abzurufen.
Die Internet Archive Wayback Machine unterstützt mehrere verschiedene APIs. Auf diese Weise wird es Entwicklern erleichtert, Informationen über Wayback-Erfassungsdaten abzurufen.
Für Ihre Lieblingswebsites „in der Zeit zurück“ zu reisen, ist der Hauptgrund, die Wayback Machine zu besuchen. Es ist auch ein großartiges Tool für alle, die den Website-Verlauf für Schulprojekte oder geschäftliche Zwecke recherchieren. Was auch immer Sie tun, besuchen Sie die Wayback Machine und sehen Sie, was Sie in ein paar einfachen Schritten entdecken können.
Für weitere Informationen über den Archive-It-Abonnementdienst des Internetarchivs besuchen Sie die offizielle Website und beginnen Sie noch heute mit Ihrem Beitrag!