Mecanismos de buscas são sistemas para realizar pesquisas na Web. Eles funcionam com um modelo de rastreamento > indexação > renderização e ranqueamento, para trazer os resultados mais relevantes na busca.
Os mecanismos de busca são uma ferramenta construída para encontrar páginas na Web a partir de pesquisas. Através de uma engenharia sofisticada, os buscadores rastreiam páginas, as indexam em suas bases de dados e ranqueiam essas páginas com base nos fatores de ranqueamento.
Atualmente, a figura dos buscadores é onipresente. Não é nem preciso saber escrever para utilizá-los. Basta utilizar um assistente virtual, disponível em smartphones e tablets, e fazer uma pergunta ou dizer termos chave. Pronto! Teremos uma página cheia de respostas.
Para nos aprofundarmos mais no tema, vamos entender como funcionam as etapas dos mecanismos de busca mencionados acima, mas com foco no buscador mais utilizado no mundo: o Google.
Quais são as etapas de funcionamento dos mecanismos de busca?
Os mecanismos de busca funcionam através de quatro etapas: rastreamento, indexação, renderização e ranqueamento. Cada etapa possui suas particularidades e formas de otimização. Confira o que você precisa saber a seguir!
Rastreamento
O rastreamento, ou crawling, é a etapa de descoberta. É através dela que os mecanismos de busca encontram páginas, links, imagens, vídeos, documentos e o que mais estiver disponível para tal.
No Google, o processo de rastreamento é realizado pelo Googlebot, que simula a ação de um usuário em computadores e dispositivos móveis. Segundo o Google, seu robô utiliza um processo de algoritmos para determinar quais sites rastrear, a frequência e quantas páginas devem ser buscadas em cada site. Sobre isso, é bom lembrar do mantra:
Se o Googlebot não puder rastrear a sua página, ela não estará entre os resultados da SERP do Google.
Isso porque esta é a etapa onde tudo começa. Se o seu site ou página não for encontrado no rastreamento, não será possível para o mecanismo de busca seguir para a indexação.
Dicas para melhorar o rastreamento de uma página
- Tenha um sitemap
- Faça uma boa linkagem interna nas suas páginas
- Solicite a indexação da página no Google Search Console
- Mantenha uma estrutura de URL simples e organizada
Cuidados com a etapa de rastreamento
Na etapa de rastreamento, há algo chamado de crawl budget, ou orçamento/cota de rastreamento. Como há um custo de recursos para que o rastreamento aconteça, o crawl budget representa o número de requisições que o mecanismo de busca faz num site em um determinado período de tempo.
Este ponto não deve preocupar a maioria dos profissionais de SEO, porque a cota funciona bem dependendo da popularidade do site e das páginas.
No entanto, quando há muitas páginas, acessos ou erros de servidor, a cota de rastreamento pode ser comprometida. Assim, as páginas do site podem demorar para serem encontradas, o que consequentemente afetará a indexação e ranqueamento na SERP. Se quiser saber mais sobre, recomendo este texto do Google.
Indexação
Após encontrar e rastrear uma página, o mecanismo de busca precisa indexá-la no seu banco de dados. Para isso, ele parte para compreender o conteúdo da página que foi encontrada. São apenas textos? Tem imagens? Como é a arquitetura da página?
Pense que milhares de novas páginas são publicadas todos os dias na Web. Caso a etapa de indexação não existisse, teríamos que vasculhar por horas até encontrar o que estávamos buscando. Com a indexação, os mecanismos de busca retornam com a informação que é mais relevante de acordo com a pesquisa do usuário.
É igual uma biblioteca com muitos livros. Se não for organizada por áreas de conhecimento, gênero e ordem alfabética, perderemos tempo tentando encontrar um livro. A figura de um profissional da biblioteconomia pode ser essencial para manter a ordem. O mesmo vale para o Googlebot e demais robôs que fazem o trabalho de indexação.
Dicas para melhorar a indexação de uma página
- Crie títulos curtos e significativos para usuário
- Tenha heading tags que fornecem o contexto da página
- Escreva textos úteis e relevante para os visitantes
- Use dados estruturados
Como prevenir uma página de ser indexada
- Bloquear a indexação através do robots.txt
- Utilizar a tag noindex na página
- Colocar login e senha na página para que apenas pessoas autorizadas possam acessá-la
Renderização
A renderização ainda é pouco citada como etapa de funcionamento dos mecanismos de busca. No entanto, desde o advento do Core Web Vitals, a renderização se tornou um papel decisivo na etapa de indexação e ranqueamento de uma página.
Voltando à explicação, a renderização é o processo de construção de uma página da Web, que acontece entre ela e o navegador.
Segundo o Google Martin Splitt, a renderização é como cozinhar. Vamos ao exemplo: na minha receita de arroz, uso alho, cebola, azeite, água quente e o próprio arroz. Estes são os ingredientes necessários, e assim que terminar de cozinhar, terei meu prato.
A renderização é igual: são várias informações e códigos que precisam ser processados e, ao juntá-la, teremos a representação visual, ou seja, uma página da Web. E aí entra o Core Web Vitals: se houver problemas no Javascript, por exemplo, isso pode causar uma falha visual que impacte o buscador, e até mesmo a pessoa usuária, de ler e utilizar a página.
Lembre-se: se o mecanismo de busca não puder renderizar o seu conteúdo, ele não poderá vê-lo ou, no pior dos casos, indexá-lo.
Imagem disponibilizada pelo Google.
Problemas comuns na renderização de páginas
- Javascript ou CSS bloqueados
- Texto muito pequeno para leitura
- Elementos clicáveis muitos próximos
- Texto maior que a tela
- Imagens com textos que não podem ser lidos
- Animações e gifs
Ranqueamento
O ranqueamento é a última etapa de funcionamento dos mecanismos de buscas e também a mais desejada e conhecida por todos os profissionais de SEO. Através dela, as páginas são listadas conforme sua relevância para a busca.
Uma página é ranqueada após passar pelas etapas anteriores, e a partir disso, os mecanismos de busca utilizam seus muitos fatores de ranqueamento para entender em qual posição entre os resultados a página deve estar.
Existem muitos fatores de ranqueamento para classificação de uma página, mas os principais são:
- Qualidade do Domínio
- Experiência do usuário
- Página (palavras-chave, meta tags, qualidade do conteúdo, etc)
- Backlinks
- Core Web Vitals
- Marca
Para melhorar o ranqueamento de uma página, o Google dá algumas dicas simples:
- Siga com as diretrizes para webmasters
- Tenha um site com bom tempo de carregamento
- Mobile-friendly
- Disponibilize conteúdos úteis e relevantes
- Mantenha seu conteúdo atualizado
Além disso, é interessante se aprofundar na intenção de busca do usuário para conseguir, de fato, construir conteúdos que façam sentido para cada pesquisa.
Quais são os principais mecanismos de busca?
Você já deve saber, mas vale relembrar: o Google não é o único mecanismo de busca do mundo. O primeiro mecanismo de busca foi lançado nos anos 90, e desde então muitos nomes surgiram.
Para apresentar os principais, vou compartilhar os dados de market share (fatia de mercado) de cada mecanismo disponível no StatCounter, uma ferramenta de análise de tráfego da Web. Dito isso, vamos conhecer os principais mecanismos de busca do mundo!
Com mais de 4 bilhões de usuários, o Google é o buscador mais utilizado do mundo, com um market share de 92.07% em 2021. No Brasil, este market share é ainda maior: 97.18%.
O mecanismo de busca perde uma grande fatia de mercado apenas na China, onde possui uma porcentagem apenas de 5.03%.
Bing
O Bing é relativamente recente. Lançado em 2009 e desenvolvido pela Microsoft, já possui 3.04% de market share, tornando-se o segundo mecanismo de busca mais utilizado no mundo.
Essa porcentagem tem aumentado graças a produtos da Microsoft como a Cortana, a assistente virtual presente nos computadores da marca.
Yahoo!
Apesar de possuir um market share de apenas 1.39% em 2021, o Yahoo! foi um dos primeiros mecanismos de busca do mundo.
O buscador foi lançado em 1995 por dois universitários da Universidade de Stanford, e quem já utilizava a Web no início dos anos 2000 deve lembrar da interface amigável e de como a marca dominava as SERPs com o Yahoo Respostas.
Baidu
O Baidu é pouco conhecido no Brasil, mas é o mecanismo de busca mais utilizado na China, um dos maiores países do mundo, com 79.49% de market share no país.
DuckDuckGo
Para quem busca por segurança, o DuckDuckGo é a escolha certa. Este mecanismo de busca, diferente dos mais conhecidos e utilizados, não coleta dados e nem mesmo guarda as informações pessoais do usuário que o utilizam.
No entanto, o buscador ainda é pouco conhecido, pois possui um market share de apenas 0.68% no mundo inteiro.
Conclusão
Entender o funcionamento dos mecanismos de busca é essencial para quem quer trabalhar com SEO, seja profissionalmente ou em projetos pessoais. Afinal, este conhecimento é a base de todas as estratégias de SEO, mas principalmente quando falamos de SEO On-Page e SEO Técnico.
E agora que você conhece as etapas até uma página ser posicionada entre os resultados do Google, espero que facilite a otimização das suas páginas e sites, assim como te dê a curiosidade necessária para ir atrás de mais informações sobre SEO.