Wayback Machine이란 무엇이며 왜 유용한가요?

Wayback Machine이란 무엇이며 왜 유용한가요?

Wayback Machine은 Internet Archive 웹사이트 에서 가장 인기 있는 부분입니다 . 2001년에 처음 도입된 무료 온라인 도구를 사용하면 "시간을 되돌려" 전 세계 웹사이트가 특정 시점에 어떻게 생겼는지 확인할 수 있습니다. Wayback Machine은 이 글을 쓰는 시점에 5,620 억 개의 웹 페이지를 제공하며 매년 더 많은 웹 페이지가 추가됩니다.

다음은 Wayback Machine을 살펴보고 이를 특별하게 만드는 요소입니다.

인터넷 아카이브 소개

Brewster Kahle와 Bruce Gilliat가 만든 Internet Archive는 "모든 지식에 대한 보편적인 액세스"라는 사명을 가진 비영리 조직입니다. 조직은 처음부터 웹 페이지, 책, 라이브 콘서트, 비디오, 이미지 및 소프트웨어 프로그램을 포함한 오디오 녹음과 같은 디지털화된 자료에 대한 무료 공개 액세스를 제공했습니다.

현재까지 Internet Archive에서 수집한 모든 것은 2개의 사본을 포함하여 70 페타바이트 이상의 서버 공간을 차지합니다. 이 조직은 책 디지털화 서비스의 기부, 보조금 및 수수료를 통해 자금을 조달합니다. 개인 정보 보호를 위해 Internet Archive는 독자의 IP 주소를 추적하지 않고 전체적으로 HTTPS(보안) 프로토콜을 사용합니다.

웨이백 머신

인터넷 아카이브의 한 부분인 Wayback Machine은 변경되거나 제거된 웹사이트 콘텐츠를 캡처하도록 설계되었습니다. 출시 이후 웹에서 가장 인기 있고 인정받는 장소 중 하나가 되었습니다. Kahle와 Gilliat는 1960년대 애니메이션 시리즈인 The Rocky and Bullwinkle Show에서 가상의 시간 여행 장치의 이름을 따서 이 사이트의 이름을 지었습니다.

Internet Archive는 2001년 10월까지 사이트를 공개하지 않았지만 Wayback Machine은 1996년 5월부터 캐시된 웹 페이지를 보관하기 시작했습니다. 2001년까지 디지털 테이프에는 선별된 과학자와 연구원만 액세스할 수 있는 정보가 저장되었습니다. 5년 후 모든 것이 대중에게 공개되었을 때(오래 계획된 대로) 이미 100억 페이지가 넘는 아카이브 페이지가 포함되어 있었습니다.

스토리지 및 컬렉션

오늘날 이 사이트는 Linux 노드 클러스터에 과거 웹 데이터를 보관합니다. Wayback Machine은 크롤링 메커니즘을 통해 웹 페이지에서 공개적으로 액세스할 수 있는 모든 정보 및 데이터 파일을 다운로드합니다. 그러나 일부 콘텐츠는 액세스할 수 없는 데이터베이스에 제한되거나 저장되기 때문에 웹사이트에 게시된 모든 것이 여기에 포함되는 것은 아닙니다. 이 때문에 개발자가 한 번에 사이트를 만든 방법에 따라 일부 웹 사이트는 다른 웹 사이트보다 더 잘 크롤링됩니다.

또한 아카이브가 최신일수록 지정된 사이트에서 더 많은 콘텐츠를 사용할 수 있음을 알 수 있습니다. 2005년에 도입된 새로운 도구 인터넷 아카이브는 최신 데이터가 더 완전한 이유 중 하나입니다. Archive-It.org는 기관과 콘텐츠 제작자가 디지털 콘텐츠 컬렉션을 수집하고 보존할 수 있도록 하여 부분적으로 캐시된 웹사이트의 불일치를 극복하는 데 도움이 됩니다.

크롤링 정보

스파이더 또는 스파이더봇이라고도 하는 웹 크롤러는 인터넷 자체만큼이나 오래되었습니다. 이러한 크롤러는 인덱싱 목적으로 웹을 지속적으로 탐색하는 인터넷 봇으로, 모든 최신 검색 엔진의 중요한 구성 요소입니다. Wayback Machine에서 웹 사이트의 디지털 스냅샷을 만드는 데 사용되는 크롤러는 시간이 지남에 따라 변경된 다양한 소스에서 제공됩니다.

곧 알게 되겠지만 스냅샷 캡처 빈도는 웹사이트에 따라 크게 다릅니다. 일반적으로 웹 사이트가 클수록(아마도 더 인기 있는) 크롤링이 더 많이 발생합니다. 또한 웹 사이트에 페이지가 변경되는 빈도에 따라 많은 것이 달라집니다. 가장 작은 웹사이트라도 특별한 이유가 없는 한 결국 크롤링됩니다. 예를 들어 암호로 보호된 사이트는 크롤링되지 않으며 사이트 소유자가 포함되지 않도록 요청한 웹사이트도 크롤링되지 않습니다.

웨이백 머신 사용하기

Wayback Machine 웹사이트는 누구나 쉽게 사용할 수 있습니다. 웹사이트의 과거 스냅샷을 찾으려면 해당 이름을 사이트의 검색 엔진에 입력하십시오. 검색 결과 페이지에서 하이퍼링크는 사이트가 보관된 날짜와 시간을 나타냅니다. 링크를 클릭하면 "시간을 되돌려" 사이트를 볼 수 있습니다.

다음 예에서는 2005년 2월과 2014년 11월에 녹화된 Apple 웹사이트의 첫 페이지와 2004년 3월과 2010년 9월 날짜의 CNN 홈페이지를 볼 수 있습니다.

참고: 이러한 크롤링에는 홈 페이지뿐만 아니라 지정된 날짜에 기록된 다른 페이지에 대한 링크도 포함됩니다.

Wayback Machine이란 무엇이며 왜 유용한가요?

Wayback Machine이란 무엇이며 왜 유용한가요?

고급 도구

연구자와 대중 모두를 위해 제작된 Wayback Machine에는 일반 사용자가 놓칠 수 있는 몇 가지 도구가 내장되어 있습니다. 예를 들어, 검색 결과 페이지는 쉽게 참조할 수 있도록 설계되었습니다. 설명했듯이 "웹 페이지나 기사에서 참조하고 싶은 아카이브된 페이지를 찾으면 URL을 복사할 수 있습니다. 퍼지 URL 일치 및 날짜 지정을 사용할 수도 있습니다. 하지만 이는 조금 더 발전된 것입니다.”

Wayback Machine을 사용하면 사이트 소유자가 "지금 페이지 저장" 기능을 사용하여 특정 페이지를 저장할 수도 있습니다. 아직 완벽하지는 않습니다. 현재 이 기능은 향후 크롤링에 사이트 URL을 추가하지 않습니다. 또한 요청은 둘 이상의 페이지를 저장하지 않습니다. 그러나 역사적 기록을 위해 웹사이트의 홈페이지를 보관하는 것은 좋은 첫 번째 단계입니다.

Wayback Machine이란 무엇이며 왜 유용한가요?

새로운 검색을 위해 매번 Wayback Machine을 방문할 필요가 없습니다. 대신 웹 브라우저 도구 모음에 주소를 입력하여 콘텐츠를 찾을 수 있습니다. 모든 검색에 다음 형식을 사용하십시오. https://web.archive.org/*/www.yoursite.com/*. 예를 들어 https://web.archive.org/*/www.groovypost.com/*을 사용하여 Luckytemplates!의 보관된 페이지를 찾으십시오.

모바일 및 개발자 도구

마지막으로 Wayback Machine은 웹을 통해서만 찾을 수 있는 것이 아닙니다. iOSAndroid 용 Wayback Machine 앱을 찾을 수 있습니다 . Chrome, Safari 및 Firefox용 확장 프로그램도 있습니다. 개발자는 Internet Archive Wayback Machine API도 확인하고 싶어할 것입���다. 이를 통해 개발자는 Wayback 캡처 데이터에 대한 정보를 더 쉽게 검색할 수 있습니다.

Internet Archive Wayback Machine은 다양한 API를 지원합니다. 이렇게 하면 개발자가 Wayback 캡처 데이터에 대한 정보를 더 쉽게 검색할 수 있습니다.

좋아하는 웹사이트로 "시간을 되돌리기"는 Wayback Machine을 방문하는 가장 큰 이유입니다. 또한 학교 프로젝트 또는 비즈니스 사용을 위해 웹 사이트 기록을 조사하는 모든 사람을 위한 훌륭한 도구입니다. 무엇을 하든지 Wayback Machine을 방문하여 몇 가지 간단한 단계를 통해 무엇을 발견할 수 있는지 확인하십시오.

인터넷 아카이브의 Archive-It 구독 서비스에 대한 자세한 내용은 공식 웹사이트  를 방문하여 지금 바로 참여하세요!

Tags: #EXPLAINER

Windows 11 화면이 멈추지만 마우스가 작동하는 11가지 빠른 방법

Windows 11 화면이 멈추지만 마우스가 작동하는 11가지 빠른 방법

상황 처리 Windows 11 화면이 정지되지만 마우스 작동 문제가 발생한 다음 Windows 11이 무작위로 정지되는 문제를 해결하기 위해 제공된 수정 사항을 시도하십시오.

수정됨: 이 앱은 Windows 10에서 보호를 위해 차단되었습니다.

수정됨: 이 앱은 Windows 10에서 보호를 위해 차단되었습니다.

Windows 10 오류로 인해 보호를 위해 차단된 이 앱을 수정하세요. 제공된 수정 사항을 시도하고 이 앱이 차단되었습니다 오류를 제거하세요.

Windows에서 USB 장치가 인식되지 않습니까? 문제를 해결하는 8가지 쉬운 방법

Windows에서 USB 장치가 인식되지 않습니까? 문제를 해결하는 8가지 쉬운 방법

Windows 10 또는 Windows 11 시스템에서 USB 장치가 인식되지 않습니다. 그런 다음 여기에 나열된 수정 사항을 따르고 USB를 쉽게 사용하십시오...

YouTube가 작동하지 않나요? 데스크톱 및 Android에서 문제를 해결하는 방법은 다음과 같습니다.

YouTube가 작동하지 않나요? 데스크톱 및 Android에서 문제를 해결하는 방법은 다음과 같습니다.

YouTube가 작동하지 않는 것은 YouTube에서 동영상 시청이 중단되는 것입니까? 수정 사항을 확인하고 YouTube 앱이 작동하지 않는 문제를 해결하세요...

FIFA 15 충돌, 지연, 정지, 끊김 현상 및 기타 문제를 수정했습니다.

FIFA 15 충돌, 지연, 정지, 끊김 현상 및 기타 문제를 수정했습니다.

제공된 솔루션을 사용하여 Windows에서 FIFA 15 충돌, 지연, 종료 및 기타 오류를 해결하고 쉽게 게임을 플레이하세요.

[11가지 방법] Windows 10 및 11에서 DLL 오류 또는 DLL 파일 누락 문제 해결

[11가지 방법] Windows 10 및 11에서 DLL 오류 또는 DLL 파일 누락 문제 해결

이 업데이트된 기사를 통해 다양한 DLL 오류를 파악하고 찾을 수 없거나 오류가 누락된 DLL 파일을 즉시 수정하는 방법을 알아보세요…

[9 수정] Windows 10의 UNEXPECTED_STORE_EXCEPTION 오류

[9 수정] Windows 10의 UNEXPECTED_STORE_EXCEPTION 오류

Windows 10 시스템에서 UNEXPECTED_STORE_EXCEPTION 오류가 발생합니까? 9가지 작업 솔루션으로 이 BSOD 오류를 해결하세요.

Microsoft Visual C++ 런타임 라이브러리 오류: 7가지 쉬운 수정

Microsoft Visual C++ 런타임 라이브러리 오류: 7가지 쉬운 수정

Microsoft Visual C++ 런타임 라이브러리 오류 Windows 문제를 해결하는 방법을 알아보고, 제공된 해결 방법을 따르고 Runtine C++ 오류를 수정하세요.

Windows 10 스토어 오류 코드 0x80072ee7 수정 [7 작업 솔루션]

Windows 10 스토어 오류 코드 0x80072ee7 수정 [7 작업 솔루션]

7가지 효과적인 작업 솔루션을 사용하여 Windows 10에서 스토어 오류 코드 0x80072ee7을 수정하고 오류 없이 Windows 스토어에 액세스하는 방법을 알아보세요.

Windows 11을 제거하는 방법

Windows 11을 제거하는 방법

Windows 11을 사용했습니다. Windows 11이 마음에 들지 않고 Windows 10으로 돌아가고 싶습니다. 라이선스에 관한 한 정품 Windows가 있었다면