Wayback Machine とは何ですか? なぜ便利なのですか?

Wayback Machine とは何ですか? なぜ便利なのですか?

Wayback Machine は、インターネット アーカイブ Web サイトで最も人気のある部分です。2001 年に初めて導入されたこの無料のオンライン ツールを使用すると、「過去にさかのぼって」、世界中の Web サイトが特定の時点でどのように見えたかを確認できます。Wayback Machine には、この記事の執筆時点で 5,620の Web ページがあり、毎年さらに多くのページが追加されています。

ここでは、Wayback Machine とその特別な点について説明します。

インターネットアーカイブの紹介

Brewster Kahle と Bruce Gilliat によって作成された Internet Archive は、「すべての知識への普遍的なアクセス」を使命とする非営利団体です。この組織は当初から、ウェブページ、書籍、ライブ コンサート、ビデオ、画像、ソフトウェア プログラムなどの録音物などのデジタル化された資料への無料のパブリック アクセスを提供してきました。

現在までに、インターネット アーカイブによって収集されたすべてのものは、すべての 2 つのコピーを含め、 70ペタバイト以上のサーバー スペースを占めています。この組織は、書籍のデジタル化サービスからの寄付、助成金、料金によって資金提供されています。プライバシーのために、インターネット アーカイブはリーダーの IP アドレスを追跡せず、HTTPS (安全な) プロトコルを使用します。

ウェイバックマシン

Internet Archive の一部である Wayback Machine は、変更または削除された Web サイトのコンテンツをキャプチャするように設計されています。立ち上げ以来、ウェブ上で最も人気があり、認知されている場所の 1 つになりました。Kahle と Gilliat は、1960 年代のアニメ シリーズ、The Rocky and Bullwinkle Show の架空の時間旅行装置にちなんでこのサイトに名前を付けました。

Internet Archive は 2001 年 10 月までサイトを公開しませんでしたが、Wayback Machine は 1996 年 5 月からキャッシュされた Web ページのアーカイブを開始しました。5 年後にすべてが公開されたとき (長い間計画されていたとおり)、すでに 100 億を超えるアーカイブ ページが含まれていました。

ストレージとコレクション

現在、このサイトは、Linux ノードのクラスター上に過去の Web データを保持しています。Wayback Machine は、そのクロール メカニズムを介して、Web ページ上の公開されているすべての情報とデータ ファイルをダウンロードします。ただし、一部のコンテンツは制限されているか、アクセスできないデータベースに保存されているため、Web サイトに投稿されたすべてがここに含まれているわけではありません。このため、開発者が一度にどのようにサイトを作成したかによって、一部の Web サイトは他の Web サイトよりもクロールされます。

また、アーカイブが新しい​​ほど、特定のサイトで利用できるコンテンツが多くなります。インターネット アーカイブが 2005 年に導入した新しいツールは、新しいデータがより完全である理由の 1 つです。Archive-It.org は、機関やコンテンツ作成者がデジタル コンテンツのコレクションを収集して保存できるようにすることで、部分的にキャッシュされた Web サイトの不整合を克服するのに役立ちます。

クロールについて

スパイダーまたはスパイダーボットと呼ばれることもある Web クローラーは、インターネット自体と同じくらい古いものです。これらのクローラーは、インデックス作成のために Web を継続的に閲覧するインターネット ボットであり、最新の検索エンジンの重要なコンポーネントとなっています。Wayback Machine が Web サイトのデジタル スナップショットを作成するために使用するクローラーは、時間の経過とともに変化したさまざまなソースから取得されます。

すぐにわかるように、スナップショット キャプチャの頻度は Web サイトによって大きく異なります。通常、Web サイトの規模が大きい (そしておそらく人気が高い) ほど、より多くのクロールが発生します。さらに、ウェブサイトのページ変更の頻度にも大きく依存します。最小の Web サイトでも、理由がない限り、最終的にはクロールされます。たとえば、パスワードで保護されたサイトはクロールされず、サイト所有者が含まれないように要求した Web サイトもクロールされません。

ウェイバック マシンの使用

Wayback Machine の Web サイトは、誰でも簡単に使用できます。Web サイトの過去のスナップショットを見つけるには、その名前をサイトの検索エンジンに入力します。検索結果ページのハイパーリンクは、サイトがアーカイブされた日時を示します。リンクをクリックすると、サイトの「昔の姿」が表示されます。

次の例では、2005 年 2 月と 2014 年 11 月に記録された Apple Web サイトのフロント ページと、2004 年 3 月と 2010 年 9 月の日付の CNN ホームページを見ることができます。

注: これらのクロールには、ホームページだけでなく、特定の日付に記録された他のページへのリンクも含まれます。

Wayback Machine とは何ですか? なぜ便利なのですか?

Wayback Machine とは何ですか? なぜ便利なのですか?

高度なツール

研究者と一般ユーザーの両方のために作成された Wayback Machine には、一般ユーザーが見落としがちなツールがいくつか組み込まれています。たとえば、検索結果ページは参照しやすいように設計されています。説明したように、「Web ページまたは記事で参照したいアーカイブ ページが見つかった場合は、その URL をコピーできます。ファジー URL マッチングと日付指定を使用することもできますが、それは少し高度です。」

Wayback Machine では、サイト所有者が「Save Page Now」機能を使用して特定のページを保存することもできます。それでも、それは完璧ではありません。現在、この機能は今後のクロールにサイト URL を追加しません。さらに、リクエストは複数のページを保存しません。ただし、履歴記録のために Web サイトのホームページをアーカイブすることは、最初のステップとしては適切です。

Wayback Machine とは何ですか? なぜ便利なのですか?

新しい検索を行うために毎回 Wayback Machine にアクセスする必要はありません。代わりに、Web ブラウザーのツールバーにアドレスを入力してコンテンツを見つけることができます。すべての検索に次の形式を使用します: https://web.archive.org/*/www.yoursite.com/*. たとえば、https://web.archive.org/*/www.groovypost.com/* を使用して、Luckytemplates のアーカイブされたページを見つけます。

モバイルおよび開発者ツール

最後に、Wayback Machine は単に Web 経由で見つけられるわけではありません。iOSおよびAndroid用の Wayback Machine アプリを見つけることができます。Chrome、Safari、および Firefox 用の拡張機能もあります。開発者は、Internet Archive Wayback Machine API も確認してください。これらにより、開発者は Wayback キャプチャ データに関する情報を簡単に取得できます。

Internet Archive Wayback Machine は、いくつかの異なる API をサポートしています。そうすることで、開発者は Wayback キャプチャ データに関する情報を簡単に取得できるようになります。

お気に入りのウェブサイトを「過去にさかのぼる」ことが、Wayback Machine にアクセスする最大の理由です。また、学校のプロジェクトやビジネスで使用するために Web サイトの履歴を調査する人にとっても優れたツールです。何をするにしても、Wayback Machine にアクセスして、いくつかの簡単な手順で何を発見できるかを確認してください。

Internet Archive の Archive-It サブスクリプション サービスの詳細については、公式 Web サイトにアクセスして、 今すぐ投稿を開始してください。

Tags: #EXPLAINER

「Windows11の画面はフリーズしますが、マウスは機能します」の11のクイックトリック

「Windows11の画面はフリーズしますが、マウスは機能します」の11のクイックトリック

Windows 11の画面がフリーズする状況に対処するが、マウスは動作する問題が発生した場合は、Windows11がランダムにフリーズする問題を解決するために提供された修正を試してください。

Omegle からの禁止を解除するにはどうすればよいですか? アクセスを回復する方法

Omegle からの禁止を解除するにはどうすればよいですか? アクセスを回復する方法

Omegle から禁止解除を取得する方法を学びますか? VPN を使用して IP アドレスを変更すると、Omegle の禁止が解除され、アカウントへのアクセスが回復されます...

[9 件の修正] Windows 10 での UNEXPECTED_STORE_EXCEPTION エラー

[9 件の修正] Windows 10 での UNEXPECTED_STORE_EXCEPTION エラー

Windows 10 システムで UNEXPECTED_STORE_EXCEPTION エラーが発生していますか? 9 つの有効な解決策を使用して、この BSOD エラーをトラブルシューティングします。

Windows 10エラーコード0xC1900208 – 0x4000Cを修正する方法?

Windows 10エラーコード0xC1900208 – 0x4000Cを修正する方法?

この記事を読んで、Windows 10 のエラー コード 0xC1900208 – 0x4000C を解決し、Windows 10 アップデートが停止する問題を解決するために提供された修正に従ってください。

Windows 11 & 10 の「エラー コード 0x80070422」を修正する [2023 ガイド]

Windows 11 & 10 の「エラー コード 0x80070422」を修正する [2023 ガイド]

Windows Updateサービスの再起動、SFCスキャンの実行などの解決策に従って、Windows 11および10のWindows Updateエラー0x80070422を修正します。

ウイルス対策とマルウェア対策: どちらが必要ですか?

ウイルス対策とマルウェア対策: どちらが必要ですか?

ウイルス対策とマルウェア対策は似ているように聞こえるかもしれませんが、異なる特徴があります。それらがあなたに提供できるさまざまな利点を学びましょう。

SD カードが間違ったサイズを表示する: SD カードを全容量に復元する方法

SD カードが間違ったサイズを表示する: SD カードを全容量に復元する方法

SD カードのサイズが間違っている場合は、ガイドを読んで、SD カードを簡単に全容量に復元する方法を学びましょう...

修正できるゲーミング PC の 4 つの一般的なエラー

修正できるゲーミング PC の 4 つの一般的なエラー

ガイドを読んで、ゲーミング PC の一般的なエラーを修正する方法を確認し、手間をかけずにお気に入りのゲームをプレイし始めましょう...

FIFA 15のクラッシュ、遅れ、フリーズ、途切れなどを修正

FIFA 15のクラッシュ、遅れ、フリーズ、途切れなどを修正

提供されているソリューションを使用して、Windows での FIFA 15 のクラッシュ、ラグ、シャッター、その他のエラーをトラブルシューティングし、ゲームを簡単にプレイできます。

Windows11をアンインストールする方法

Windows11をアンインストールする方法

Windows 11を試しましたが、Windows 11が気に入らなかったので、Windows 10に戻りたいと考えています。ライセンスに関する限り、正規のWindowsを使用している場合