Buscadores - Google: como a pesquisa funciona


Buscadores - Google: como a pesquisa funciona

 

Com a missão de organizar a informação mundial e torná-la universalmente acessível e útil, o Google é provavelmente a maior empresa da internet. Só no buscador, seu principal e mais antigo serviço, mais de um bilhão de solicitações de pesquisa são feitas todos os dias. E ainda tem os outros serviços on-line, como Gmail, YouTube, Google Maps, Blogger, Google+, Orkut, Picasa, AdSense, AdWords e Analytics, para citar apenas os mais famosos. Com tudo isso, a Google processa aproximadamente 20 petabytes (20.971.520 GB) de dados gerados por usuários todos os dias.

 

Localização de informações por meio da indexação

A jornada de uma consulta começa antes mesmo que você digite sua pesquisa, com o rastreamento e a indexação de trilhões de documentos pela Web.

Através de programas conhecidos como "rastreadores da Web" para descobrir páginas disponíveis publicamente. O rastreador mais conhecido é chamado de "Googlebot". Os rastreadores analisam as páginas da Web e seguem os links contidos nelas, como o usuário faz ao navegar na Internet. Eles avançam de link em link e transmitem aos servidores do Google os dados destas páginas da Web.

O processo de rastreamento começa com uma lista de endereços da Web de rastreamentos anteriores e mapas de sites fornecidos pelos proprietários de websites. Ao acessar esses websites, os rastreadores procuram por links para outras páginas a visitar. O programa dá atenção especial a estes novos sites, a alterações em sites existentes e à links inativos.

Programas de computador determinam os sites a rastrear, a frequência do rastreamento e o número de páginas a buscar em cada site. O Google não aceita pagamentos para aumentar a frequência do rastreamento de um site para os resultados de pesquisa na Web.

 

Organização de informações por meio da indexação

A Web é como uma biblioteca pública em constante expansão, com bilhões de livros e nenhuma administração centralizada. O Google reúne as páginas durante o processo de rastreamento e cria um índice para saber exatamente como encontrar o que procuram. De forma muito semelhante ao índice na parte de trás de um livro, o índice do Google inclui informações sobre as palavras e onde podem ser encontradas. Quando o usuário realiza uma pesquisa no nível mais básico, os algoritmos procuram os termos de sua pesquisa no índice para localizar as páginas adequadas.

O processo de pesquisa torna-se muito mais complexo a partir daí. Quando o usuário procura por "cães" , não quer ver uma página com a palavra "cães" escrita centenas de vezes. Mas provavelmente quer imagens, vídeos ou uma lista de raças. Os sistemas de indexação do Google levam em consideração vários aspectos diferentes das páginas, como sua data de publicação, seu conteúdo em termos de fotos e vídeos, e muito mais. Com o Painel do conhecimento, a busca vai além da mera associação de palavras-chave.

 


© 2017 - 2025 by NeoCyber.