Что такое Wayback Machine и почему она полезна?

Что такое Wayback Machine и почему она полезна?

Wayback Machine — самая популярная часть веб- сайта Internet Archive . Впервые представленный в 2001 году, бесплатный онлайн-инструмент позволяет вам вернуться «в прошлое», чтобы увидеть, как выглядели веб-сайты по всему миру в определенные моменты времени. На момент написания этой статьи Wayback Machine содержит 562 миллиарда веб-страниц, и каждый год их количество увеличивается.

Вот взгляд на Wayback Machine и на то, что делает его особенным.

Введение в Интернет-архив

Интернет-архив, созданный Брюстером Кале и Брюсом Гиллиатом, является некоммерческой организацией с заявленной миссией «всеобщего доступа ко всем знаниям». С самого начала организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программы.

На сегодняшний день все, что собрано Интернет-архивом, занимает более 70 петабайт дискового пространства, включая две копии всего. Организация финансируется за счет пожертвований, грантов и сборов от услуг по оцифровке книг. В целях конфиденциальности Интернет-архив не отслеживает IP-адреса своих читателей и везде использует протокол HTTPS (защищенный).

Машина обратного пути

Только одна часть Интернет-архива, Wayback Machine, была разработана для сбора содержимого веб-сайтов, которое было изменено или удалено. С момента запуска он стал одним из самых популярных и узнаваемых мест в Интернете. Кале и Гиллиат назвали это место в честь вымышленного устройства для путешествий во времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкла».

Хотя Интернет-архив не открывал сайт для публики до октября 2001 года, Wayback Machine начала архивировать кэшированные веб-страницы с мая 1996 года. До 2001 года цифровые ленты хранили информацию, доступную только избранным ученым и исследователям. Когда пять лет спустя все было опубликовано (как и планировалось давно), оно уже содержало более 10 миллиардов заархивированных страниц.

Хранение и коллекции

Сегодня сайт хранит исторические веб-данные в кластере узлов Linux. Wayback Machine загружает всю общедоступную информацию и файлы данных на веб-страницах с помощью своего механизма сканирования. Однако сюда включено не все, что размещено на веб-сайте, поскольку некоторый контент ограничен или хранится в базах данных, к которым нет доступа. Из-за этого некоторые веб-сайты сканируются лучше, чем другие, в зависимости от того, как разработчики создавали сайт в определенный момент времени.

Вы также заметите, что чем новее архив, тем больше контента доступно для любого данного сайта. Новый инструмент, представленный Интернет-архивом в 2005 году, является одной из причин, по которой новые данные являются более полными. Archive-It.org помогает устранить несоответствия на частично кэшированных веб-сайтах, позволяя учреждениям и создателям контента собирать и сохранять коллекции цифрового контента.

О сканировании

Веб-сканеры, иногда называемые пауками или роботами-пауками, так же стары, как и сам Интернет. Эти поисковые роботы — это интернет-боты, которые постоянно просматривают Интернет в целях индексации, что делает их важным компонентом любой современной поисковой системы. Сканеры, используемые Wayback Machine для создания цифровых снимков веб-сайтов, поступают из различных источников, которые со временем менялись.

Как вы быстро заметите, частота создания моментальных снимков сильно различается в зависимости от веб-сайта. Как правило, чем больше (и, возможно, популярнее) веб-сайт, тем чаще он сканируется. Кроме того, многое зависит от того, как часто на веб-сайте меняются страницы. Даже самые маленькие веб-сайты в конечном итоге сканируются, если нет причины, по которой это не происходит. Например, сайты, защищенные паролем, не сканируются, равно как и веб-сайты, владельцы которых просили их не включать.

Использование машины обратного пути

Веб-сайт Wayback Machine прост в использовании для всех. Чтобы найти исторические снимки веб-сайта, введите его имя в поисковую систему сайта. На странице результатов поиска гиперссылки обозначают даты и время архивации сайта. Нажмите на ссылку, чтобы увидеть сайт «назад во времени».

В следующих примерах вы можете увидеть первую страницу веб-сайта Apple, записанную в феврале 2005 г. и ноябре 2014 г., и домашнюю страницу CNN, датированную мартом 2004 г. и сентябрем 2010 г.

Примечание. Эти обходы также включают ссылки на другие страницы, зарегистрированные в указанные даты, а не только на домашние страницы.

Что такое Wayback Machine и почему она полезна?

Что такое Wayback Machine и почему она полезна?

Расширенные инструменты

Wayback Machine, созданная как для исследователей, так и для широкой публики, имеет несколько встроенных инструментов, которые обычные пользователи могут пропустить. Например, по дизайну страницы результатов поиска легко найти. Как объяснялось: «Если вы найдете заархивированную страницу, на которую хотите сослаться на своей веб-странице или в статье, вы можете скопировать URL-адрес. Вы даже можете использовать нечеткое сопоставление URL и указание даты… но это немного более продвинуто».

Wayback Machine также позволяет владельцам сайтов использовать функцию «Сохранить страницу сейчас» для сохранения определенной страницы. И все же, это не идеально. В настоящее время эта функция не добавляет URL-адрес сайта ни в какие будущие обходы. Кроме того, запрос не сохраняет более одной страницы. Тем не менее, это хороший первый шаг, чтобы заархивировать домашнюю страницу вашего веб-сайта для исторической записи.

Что такое Wayback Machine и почему она полезна?

Вам не нужно каждый раз посещать Wayback Machine, чтобы выполнить новый поиск. Вместо этого вы можете найти контент, введя адрес на панели инструментов веб-браузера. Используйте этот формат для всех поисков: https://web.archive.org/*/www.yoursite.com/*. Например, используйте https://web.archive.org/*/www.groovypost.com/*, чтобы найти заархивированные страницы для Luckytemplates!

Мобильные инструменты и инструменты для разработчиков

Наконец, Wayback Machine находится не только в Интернете. Вы можете найти приложение Wayback Machine для iOS и Android . Есть также расширения для Chrome, Safari и Firefox. Разработчики также захотят проверить API-интерфейсы Internet Archive Wayback Machine. Это облегчает разработчикам получение информации о данных захвата Wayback.

Internet Archive Wayback Machine поддерживает несколько различных API. Таким образом, разработчикам будет проще получать информацию о данных захвата Wayback.

Путешествие «в прошлое» для ваших любимых веб-сайтов — причина № 1 для посещения Wayback Machine. Это также отличный инструмент для тех, кто изучает историю веб-сайтов для школьных проектов или использования в бизнесе. Что бы вы ни делали, посетите Wayback Machine и посмотрите, что вы можете открыть, выполнив несколько простых шагов.

Для получения дополнительной информации о службе подписки Archive-It Интернет-архива посетите официальный веб-сайт  и начните вносить свой вклад уже сегодня!

Tags: #EXPLAINER

11 быстрых приемов для «экран Windows 11 зависает, но мышь работает»

11 быстрых приемов для «экран Windows 11 зависает, но мышь работает»

Устранение ситуации Экран Windows 11 зависает, но мышь работает, затем попробуйте исправления, данные для устранения случайного зависания Windows 11

Исправлены сбои, зависания, зависания, подтормаживания и другие ошибки в FIFA 15.

Исправлены сбои, зависания, зависания, подтормаживания и другие ошибки в FIFA 15.

Устраняйте сбои, зависания, зависания и другие ошибки FIFA 15 в Windows с помощью предлагаемых решений и играйте в игру с легкостью.

USB-устройство не распознается в Windows? 8 простых способов это исправить

USB-устройство не распознается в Windows? 8 простых способов это исправить

USB-устройство не распознано в вашей системе Windows 10 или Windows 11, затем выполните перечисленные здесь исправления и с легкостью начните использовать USB...

ИСПРАВЛЕНО: это приложение было заблокировано в целях вашей защиты в Windows 10.

ИСПРАВЛЕНО: это приложение было заблокировано в целях вашей защиты в Windows 10.

Исправьте это приложение было заблокировано для вашей защиты из-за ошибки Windows 10. Попробуйте указанные исправления и избавьтесь от ошибки «Это приложение заблокировано».

SD-карта показывает неправильный размер: как восстановить SD-карту до полной емкости

SD-карта показывает неправильный размер: как восстановить SD-карту до полной емкости

Если ваша SD-карта показывает неправильный размер, прочтите наше руководство, чтобы узнать, как легко восстановить SD-карту до полной емкости...

Как разбаниться в Omegle? Способы восстановления доступа

Как разбаниться в Omegle? Способы восстановления доступа

Узнайте, как снять бан с Omegle? Используйте VPN и измените свой IP-адрес, чтобы разблокировать Omegle и восстановить доступ к своей учетной записи...

Ошибка Outlook 0x800CCC13 Невозможно подключиться к сети [РЕШЕНО]

Ошибка Outlook 0x800CCC13 Невозможно подключиться к сети [РЕШЕНО]

Следуйте решениям, чтобы исправить ошибку отправки/получения Outlook 0x800CCC13 после обновления Windows 10 и предотвратить невозможность подключения 0x800ccc13 к сети...

Ютуб не работает? Вот как это исправить на настольном компьютере и Android

Ютуб не работает? Вот как это исправить на настольном компьютере и Android

Не работает YouTube - это прерывание просмотра видео на YouTube? Проверьте исправления и решите, что приложение YouTube не работает...

Исправьте «Код ошибки 0x80070422» в Windows 11 и 10 [РУКОВОДСТВО НА 2023 ГОД]

Исправьте «Код ошибки 0x80070422» в Windows 11 и 10 [РУКОВОДСТВО НА 2023 ГОД]

Исправьте ошибку Центра обновления Windows 0x80070422 в Windows 11 и 10, следуя таким решениям, как перезагрузка службы обновления Windows, запуск сканирования SFC и т. д.

Как удалить Windows 11

Как удалить Windows 11

Вы пробовали Windows 11. Вам не нравилась Windows 11, и вы хотели бы вернуться к Windows 10. Что касается лицензии, если у вас была подлинная Windows