Wayback Machine とは何ですか? なぜ便利なのですか?

Wayback Machine は、インターネット アーカイブ Web サイトで最も人気のある部分です。2001 年に初めて導入されたこの無料のオンライン ツールを使用すると、「過去にさかのぼって」、世界中の Web サイトが特定の時点でどのように見えたかを確認できます。Wayback Machine には、この記事の執筆時点で 5,620の Web ページがあり、毎年さらに多くのページが追加されています。

ここでは、Wayback Machine とその特別な点について説明します。

インターネットアーカイブの紹介

Brewster Kahle と Bruce Gilliat によって作成された Internet Archive は、「すべての知識への普遍的なアクセス」を使命とする非営利団体です。この組織は当初から、ウェブページ、書籍、ライブ コンサート、ビデオ、画像、ソフトウェア プログラムなどの録音物などのデジタル化された資料への無料のパブリック アクセスを提供してきました。

現在までに、インターネット アーカイブによって収集されたすべてのものは、すべての 2 つのコピーを含め、 70ペタバイト以上のサーバー スペースを占めています。この組織は、書籍のデジタル化サービスからの寄付、助成金、料金によって資金提供されています。プライバシーのために、インターネット アーカイブはリーダーの IP アドレスを追跡せず、HTTPS (安全な) プロトコルを使用します。

ウェイバックマシン

Internet Archive の一部である Wayback Machine は、変更または削除された Web サイトのコンテンツをキャプチャするように設計されています。立ち上げ以来、ウェブ上で最も人気があり、認知されている場所の 1 つになりました。Kahle と Gilliat は、1960 年代のアニメ シリーズ、The Rocky and Bullwinkle Show の架空の時間旅行装置にちなんでこのサイトに名前を付けました。

Internet Archive は 2001 年 10 月までサイトを公開しませんでしたが、Wayback Machine は 1996 年 5 月からキャッシュされた Web ページのアーカイブを開始しました。5 年後にすべてが公開されたとき (長い間計画されていたとおり)、すでに 100 億を超えるアーカイブ ページが含まれていました。

ストレージとコレクション

現在、このサイトは、Linux ノードのクラスター上に過去の Web データを保持しています。Wayback Machine は、そのクロール メカニズムを介して、Web ページ上の公開されているすべての情報とデータ ファイルをダウンロードします。ただし、一部のコンテンツは制限されているか、アクセスできないデータベースに保存されているため、Web サイトに投稿されたすべてがここに含まれているわけではありません。このため、開発者が一度にどのようにサイトを作成したかによって、一部の Web サイトは他の Web サイトよりもクロールされます。

また、アーカイブが新しい​​ほど、特定のサイトで利用できるコンテンツが多くなります。インターネット アーカイブが 2005 年に導入した新しいツールは、新しいデータがより完全である理由の 1 つです。Archive-It.org は、機関やコンテンツ作成者がデジタル コンテンツのコレクションを収集して保存できるようにすることで、部分的にキャッシュされた Web サイトの不整合を克服するのに役立ちます。

クロールについて

スパイダーまたはスパイダーボットと呼ばれることもある Web クローラーは、インターネット自体と同じくらい古いものです。これらのクローラーは、インデックス作成のために Web を継続的に閲覧するインターネット ボットであり、最新の検索エンジンの重要なコンポーネントとなっています。Wayback Machine が Web サイトのデジタル スナップショットを作成するために使用するクローラーは、時間の経過とともに変化したさまざまなソースから取得されます。

すぐにわかるように、スナップショット キャプチャの頻度は Web サイトによって大きく異なります。通常、Web サイトの規模が大きい (そしておそらく人気が高い) ほど、より多くのクロールが発生します。さらに、ウェブサイトのページ変更の頻度にも大きく依存します。最小の Web サイトでも、理由がない限り、最終的にはクロールされます。たとえば、パスワードで保護されたサイトはクロールされず、サイト所有者が含まれないように要求した Web サイトもクロールされません。

ウェイバック マシンの使用

Wayback Machine の Web サイトは、誰でも簡単に使用できます。Web サイトの過去のスナップショットを見つけるには、その名前をサイトの検索エンジンに入力します。検索結果ページのハイパーリンクは、サイトがアーカイブされた日時を示します。リンクをクリックすると、サイトの「昔の姿」が表示されます。

次の例では、2005 年 2 月と 2014 年 11 月に記録された Apple Web サイトのフロント ページと、2004 年 3 月と 2010 年 9 月の日付の CNN ホームページを見ることができます。

注: これらのクロールには、ホームページだけでなく、特定の日付に記録された他のページへのリンクも含まれます。

Wayback Machine とは何ですか? なぜ便利なのですか?

Wayback Machine とは何ですか? なぜ便利なのですか?

高度なツール

研究者と一般ユーザーの両方のために作成された Wayback Machine には、一般ユーザーが見落としがちなツールがいくつか組み込まれています。たとえば、検索結果ページは参照しやすいように設計されています。説明したように、「Web ページまたは記事で参照したいアーカイブ ページが見つかった場合は、その URL をコピーできます。ファジー URL マッチングと日付指定を使用することもできますが、それは少し高度です。」

Wayback Machine では、サイト所有者が「Save Page Now」機能を使用して特定のページを保存することもできます。それでも、それは完璧ではありません。現在、この機能は今後のクロールにサイト URL を追加しません。さらに、リクエストは複数のページを保存しません。ただし、履歴記録のために Web サイトのホームページをアーカイブすることは、最初のステップとしては適切です。

Wayback Machine とは何ですか? なぜ便利なのですか?

新しい検索を行うために毎回 Wayback Machine にアクセスする必要はありません。代わりに、Web ブラウザーのツールバーにアドレスを入力してコンテンツを見つけることができます。すべての検索に次の形式を使用します: https://web.archive.org/*/www.yoursite.com/*. たとえば、https://web.archive.org/*/www.groovypost.com/* を使用して、Luckytemplates のアーカイブされたページを見つけます。

モバイルおよび開発者ツール

最後に、Wayback Machine は単に Web 経由で見つけられるわけではありません。iOSおよびAndroid用の Wayback Machine アプリを見つけることができます。Chrome、Safari、および Firefox 用の拡張機能もあります。開発者は、Internet Archive Wayback Machine API も確認してください。これらにより、開発者は Wayback キャプチャ データに関する情報を簡単に取得できます。

Internet Archive Wayback Machine は、いくつかの異なる API をサポートしています。そうすることで、開発者は Wayback キャプチャ データに関する情報を簡単に取得できるようになります。

お気に入りのウェブサイトを「過去にさかのぼる」ことが、Wayback Machine にアクセスする最大の理由です。また、学校のプロジェクトやビジネスで使用するために Web サイトの履歴を調査する人にとっても優れたツールです。何をするにしても、Wayback Machine にアクセスして、いくつかの簡単な手順で何を発見できるかを確認してください。

Internet Archive の Archive-It サブスクリプション サービスの詳細については、公式 Web サイトにアクセスして、 今すぐ投稿を開始してください。

Tags: #EXPLAINER

Leave a Comment

修正済み:コード1Windows11でプロセスが終了した[詳細ガイド]

修正済み:コード1Windows11でプロセスが終了した[詳細ガイド]

コード1で終了したプロセスを修正するソリューションをお探しですか?次に、この記事を読んで、解決策を1つずつ実行してください...

Windows11でアクションセンターを開いてカスタマイズする方法

Windows11でアクションセンターを開いてカスタマイズする方法

Windows 11のアクションセンターは、新しい機能を追加してカスタマイズできます。アクションセンターに簡単にアクセスして設定を変更する方法を学びましょう。

Windows 11の更新が61%でスタックする問題を修正しました[9つの実証済みの方法]

Windows 11の更新が61%でスタックする問題を修正しました[9つの実証済みの方法]

Windows 11の更新が61%や99%でスタックする問題を解決する方法を専門家の解決策に従って学びましょう。

[解決済み]MinecraftがWindows11および10を起動しない問題を修正する方法は?

[解決済み]MinecraftがWindows11および10を起動しない問題を修正する方法は?

Minecraftが問題を起動しない問題を修正する方法を学び、問題が発生する理由も理解し、テスト済みのソリューションに従ってMinecraftがWindows10とPS4をロードしない問題を修正します。

Windows11でYoutubeの遅れを修正する方法

Windows11でYoutubeの遅れを修正する方法

Windows11でYouTubeの遅れを修正するためのさまざまな方法を紹介します。次の手順を試して、スムーズなストリーミング体験を手に入れましょう。

Windows 11 の CTF ローダー (cftmon.exe) とは

Windows 11 の CTF ローダー (cftmon.exe) とは

Windows PC で作業していると、CTF Loader とは何か疑問に思うかもしれません。ctfmon.exe プロセスについて知っておくべきことは次のとおりです。

Windows11をダウンロードした後にインターネットが遅くなるのを修正する方法

Windows11をダウンロードした後にインターネットが遅くなるのを修正する方法

Windows 11にアップグレード後、インターネットの速度が遅くなる問題を解決するための方法を紹介します。

Windows11および10でのBroadcomBCM20702A0ドライバーエラーを修正

Windows11および10でのBroadcomBCM20702A0ドライバーエラーを修正

Bluetoothデバイス使用時にBCM20702A0ドライバーのエラーが表示された場合は、この記事で解決方法を見つけてください。

「Windows11の画面はフリーズしますが、マウスは機能します」の11のクイックトリック

「Windows11の画面はフリーズしますが、マウスは機能します」の11のクイックトリック

Windows 11の画面がフリーズする状況に対処するが、マウスは動作する問題が発生した場合は、Windows11がランダムにフリーズする問題を解決するために提供された修正を試してください。

Omegle からの禁止を解除するにはどうすればよいですか? アクセスを回復する方法

Omegle からの禁止を解除するにはどうすればよいですか? アクセスを回復する方法

Omegle から禁止解除を取得する方法を学びますか? VPN を使用して IP アドレスを変更すると、Omegle の禁止が解除され、アカウントへのアクセスが回復されます...