O que é a Wayback Machine e por que é útil?

O que é a Wayback Machine e por que é útil?

A Wayback Machine é a parte mais popular do site Internet Archive . Introduzida pela primeira vez em 2001, a ferramenta online gratuita permite que você volte no tempo para ver como eram os sites em todo o mundo em determinados momentos. A Wayback Machine possui 562 bilhões de páginas da web no momento da redação deste artigo, com muitas mais adicionadas a cada ano.

Aqui está uma olhada no Wayback Machine e o que o torna especial.

Introdução ao arquivo da Internet

Criado por Brewster Kahle e Bruce Gilliat, o Internet Archive é uma organização sem fins lucrativos com a missão declarada de “acesso universal a todo o conhecimento”. Desde o início, a organização forneceu acesso público gratuito a materiais digitalizados, como páginas da web, livros, gravações de áudio, incluindo shows ao vivo, vídeos, imagens e programas de software.

Até o momento, tudo coletado pelo Internet Archive ocupa mais de 70 Petabytes de espaço no servidor, incluindo duas cópias de tudo. A organização é financiada através de doações, subsídios e taxas de serviços de digitalização de livros. Para privacidade, o Internet Archive não acompanha os endereços IP de seus leitores e usa o protocolo HTTPS (seguro).

A máquina de retorno

Apenas uma parte do Internet Archive, a Wayback Machine, foi projetada para capturar o conteúdo do site que foi alterado ou removido. Desde o lançamento, tornou-se um dos lugares mais populares e reconhecidos na web. Kahle e Gilliat nomearam o site em homenagem ao dispositivo fictício de viagem no tempo da série animada dos anos 1960, The Rocky and Bullwinkle Show.

Embora o Internet Archive não tenha lançado o site ao público até outubro de 2001, a Wayback Machine começou a arquivar páginas da web em cache a partir de maio de 1996. Até 2001, as fitas digitais armazenavam informações acessíveis apenas a cientistas e pesquisadores selecionados. Quando tudo foi publicado cinco anos depois (como foi planejado há muito tempo), já continha mais de 10 bilhões de páginas arquivadas.

Armazenamento e Coleções

Hoje, o site mantém dados históricos da web em um cluster de nós Linux. O Wayback Machine baixa todas as informações e arquivos de dados publicamente acessíveis em páginas da Web por meio de seu mecanismo de rastreamento. No entanto, nem tudo que é postado em um site está incluído aqui, pois alguns conteúdos são restritos ou armazenados em bancos de dados, que não são acessíveis. Por causa disso, alguns sites são mais bem rastreados do que outros, dependendo de como os desenvolvedores criaram um site de cada vez.

Você também notará que quanto mais recente for o arquivo, mais conteúdo estará disponível para qualquer site. Uma nova ferramenta que o Internet Archive introduziu em 2005 é uma das razões pelas quais os dados mais recentes são mais completos. O Archive-It.org ajuda a superar inconsistências em sites parcialmente armazenados em cache, permitindo que instituições e criadores de conteúdo coletem e preservem coleções de conteúdo digital.

Sobre o rastreamento

Os rastreadores da Web, às vezes chamados de spider ou spiderbot, são tão antigos quanto a própria Internet. Esses rastreadores são bots da Internet que navegam continuamente na Web para fins de indexação, tornando-os um componente importante de qualquer mecanismo de pesquisa moderno. Os rastreadores usados ​​pelo Wayback Machine para criar instantâneos digitais de sites vêm de várias fontes, que mudaram ao longo do tempo.

Como você notará rapidamente, a frequência das capturas de instantâneos varia muito de acordo com o site. Normalmente, quanto maior (e talvez mais popular) um site, mais rastreamento ocorre. Além disso, depende muito da frequência com que um site muda de página. Mesmo os menores sites são eventualmente rastreados, a menos que haja uma razão para não serem. Por exemplo, sites protegidos por senha não são rastreados, nem sites cujos proprietários de sites solicitaram que eles não fossem incluídos.

Usando a máquina de retorno

O site Wayback Machine é fácil para qualquer um usar. Para encontrar instantâneos históricos de um site, digite seu nome no mecanismo de pesquisa do site. Na página de resultados da pesquisa, os hiperlinks indicam as datas e horas em que um site foi arquivado. Clique no link para ver o site “de volta no tempo”.

Nos exemplos a seguir, você pode ver a primeira página do site da Apple gravada em fevereiro de 2005 e novembro de 2014, e a página inicial da CNN de uma data em março de 2004 e setembro de 2010.

Observação: esses rastreamentos também incluem links para outras páginas conforme registrado nas datas especificadas, não apenas as páginas iniciais.

O que é a Wayback Machine e por que é útil?

O que é a Wayback Machine e por que é útil?

Ferramentas avançadas

Criado tanto para pesquisadores quanto para o público, o Wayback Machine possui algumas ferramentas integradas que os usuários casuais podem sentir falta. Por exemplo, por design, as páginas de resultados de pesquisa são fáceis de consultar. Conforme explicado, “Se você encontrar uma página arquivada à qual gostaria de fazer referência em sua página da Web ou em um artigo, poderá copiar a URL. Você pode até usar correspondência de URL difusa e especificação de data… mas isso é um pouco mais avançado.”

O Wayback Machine também permite que os proprietários de sites usem um recurso “Salvar página agora” para salvar uma página específica. E ainda assim, não é perfeito. Atualmente, o recurso não adiciona a URL do site a nenhum rastreamento futuro. Além disso, a solicitação não salva mais de uma página. No entanto, é um bom primeiro passo arquivar a página inicial do seu site para o registro histórico.

O que é a Wayback Machine e por que é útil?

Você não precisa visitar o Wayback Machine toda vez para fazer uma nova pesquisa. Em vez disso, você pode encontrar conteúdo digitando o endereço na barra de ferramentas do navegador da web. Use este formato para todas as pesquisas: https://web.archive.org/*/www.yoursite.com/*. Por exemplo, use https://web.archive.org/*/www.groovypost.com/* para encontrar páginas arquivadas para o Luckytemplates!

Ferramentas para dispositivos móveis e para desenvolvedores

Finalmente, o Wayback Machine não está localizado apenas na web. Você pode encontrar um aplicativo Wayback Machine para iOS e Android . Há também extensões para Chrome, Safari e Firefox. Os desenvolvedores também vão querer verificar as APIs do Internet Archive Wayback Machine. Isso torna mais fácil para os desenvolvedores recuperar informações sobre dados de captura Wayback.

O Internet Archive Wayback Machine oferece suporte a várias APIs diferentes. Ao fazer isso, fica mais fácil para os desenvolvedores recuperar informações sobre os dados de captura do Wayback.

Voltar no tempo para seus sites favoritos é o motivo número 1 para visitar o Wayback Machine. Também é uma ótima ferramenta para quem pesquisa o histórico do site para projetos escolares ou uso comercial. Faça o que fizer, visite o Wayback Machine e veja o que você pode descobrir em algumas etapas simples.

Para obter mais informações sobre o serviço de assinatura Archive-It do Internet Archive, visite o site oficial  e comece a contribuir hoje mesmo!

Tags: #EXPLAINER

11 truques rápidos para “a tela do Windows 11 congela, mas o mouse funciona”

11 truques rápidos para “a tela do Windows 11 congela, mas o mouse funciona”

Lidando com a situação A tela do Windows 11 congela, mas o problema do mouse funciona e tente as correções fornecidas para resolver o congelamento aleatório do Windows 11

Como cancelar o banimento do Omegle? Maneiras de recuperar o acesso

Como cancelar o banimento do Omegle? Maneiras de recuperar o acesso

Aprenda como ser desbanido do Omegle? Use uma VPN e altere seu endereço IP para cancelar o banimento do Omegle e recuperar o acesso à sua conta...

YouTube não funciona? Veja como consertar isso no desktop e no Android

YouTube não funciona? Veja como consertar isso no desktop e no Android

O YouTube não funcionar é uma interrupção na exibição de vídeos no YouTube? Verifique as correções e resolva o problema de o aplicativo YouTube não funcionar...

Como corrigir o código de erro do Windows 10 0xC1900208 – 0x4000C?

Como corrigir o código de erro do Windows 10 0xC1900208 – 0x4000C?

Leia o artigo para seguir as correções fornecidas para resolver o código de erro 0xC1900208 – 0x4000C no Windows 10 e se livrar do problema de travamento da atualização do Windows 10

Corrigir “Código de erro 0x80070422” no Windows 11 e 10 [GUIA 2023]

Corrigir “Código de erro 0x80070422” no Windows 11 e 10 [GUIA 2023]

Corrija o erro do Windows Update 0x80070422 no Windows 11 e 10 seguindo soluções como reiniciar o Windows Update Service, executar a verificação SFC, etc.

Erro da biblioteca Microsoft Visual C++ Runtime: 7 soluções fáceis

Erro da biblioteca Microsoft Visual C++ Runtime: 7 soluções fáceis

Aprenda como solucionar o erro da biblioteca de tempo de execução do Microsoft Visual C++ no Windows, siga as soluções fornecidas e corrija o erro do Runtine C++

Corrigir código de erro da loja do Windows 10 0x80072ee7 [7 soluções de trabalho]

Corrigir código de erro da loja do Windows 10 0x80072ee7 [7 soluções de trabalho]

Aprenda como corrigir o código de erro da loja 0x80072ee7 no Windows 10 usando 7 soluções funcionais eficazes e acesse a Windows Store sem erros.

[9 Correções] Erro UNEXPECTED_STORE_EXCEPTION no Windows 10

[9 Correções] Erro UNEXPECTED_STORE_EXCEPTION no Windows 10

Você está recebendo o erro UNEXPECTED_STORE_EXCEPTION em seu sistema Windows 10? Solucione esse erro BSOD com 9 soluções funcionais.

Antivírus x antimalware: o que você precisa?

Antivírus x antimalware: o que você precisa?

Antivírus e antimalware podem parecer semelhantes, mas têm características distintas. Conheça os diferentes benefícios que eles podem lhe oferecer.

4 erros comuns em PCs para jogos que podem ser corrigidos

4 erros comuns em PCs para jogos que podem ser corrigidos

Leia nosso guia para descobrir como corrigir erros comuns em PCs para jogos e comece a jogar seus jogos favoritos sem complicações...