Mais rastreio não significa que terá uma posição melhor, mas se as suas páginas não forem rastreadas e indexadas, elas não terão posicionamento algum.
A maioria dos websites não precisa de se preocupar com o orçamento de rastreio, mas há alguns casos em que pode querer dar uma vista de olhos. Vejamos alguns desses casos.
- Quando se deve preocupar com o orçamento de rastreio?
- Como verificar a atividade de rastreio?
- O que conta para o orçamento de rastreio?
- Como o Google ajusta o seu rastreio?
- Como posso tornar o rastreio do Google mais rápido?
- Como posso tornar o rastreio do Google mais lento?
Normalmente, não precisa de se preocupar com o orçamento de rastreio em páginas populares. Geralmente são páginas mais recentes, que não estão bem vinculadas ou não mudam muito, que não são rastreadas com frequência.
O orçamento de rastreio pode ser uma preocupação para websites mais novos, especialmente aqueles com muitas páginas. O seu servidor pode suportar mais rastreio, mas como o seu website é novo e provavelmente ainda não é muito popular, um motor de pesquisa pode não querer rastreá-lo muito. Isto é principalmente uma desconexão de expectativas. Deseja que as suas páginas sejam rastreadas e indexadas, mas o Google não sabe se vale a pena indexá-las e pode não querer rastrear a quantidade de páginas que deseja.
O orçamento de rastreio também pode ser uma preocupação para websites maiores, com milhões de páginas ou websites que são atualizados com frequência. Em geral, se tem muitas páginas que não são rastreadas ou atualizadas com a frequência que gostaria, convém acelerar o rastreio. Falaremos sobre como fazer isso mais à frente neste artigo.
Se deseja ter uma visão geral da atividade de rastreio do Google e quaisquer problemas identificados, o melhor lugar para procurar é o relatório de estatísticas de rastreio no Google Search Console.
Existem vários relatórios para ajudá-lo a identificar mudanças no comportamento de rastreio, problemas com rastreio e fornecer mais informações sobre como o Google está a rastrear o seu website.
Definitivamente, tenciona verificar os estados de rastreio sinalizados, como os mostrados aqui:
Também há carimbos de data/hora de quando as páginas foram rastreadas pela última vez.
Se quiser ver hits de todos os bots e utilizadores, precisará de aceder aos seus arquivos de registo. Dependendo da hospedagem e configuração, pode ter acesso a ferramentas como Awstats e Webalizer como pode ser visto aqui num alojamento partilhado com cPanel. Estas ferramentas mostram alguns dados agregados dos seus arquivos de log.
Para configurações mais complexas, terá que obter acesso e armazenar dados dos arquivos de log brutos, possivelmente de várias fontes. Também pode precisar de ferramentas especializadas para projetos maiores, como uma pilha ELK (elasticsearch, logstash, kibana) que permite o armazenamento, processamento e visualização de arquivos de log. Existem também ferramentas de análise de registo, como o Splunk.
Todos os URLs e solicitações contam para o seu orçamento de rastreio. Isto inclui URLs alternativos, como páginas AMP ou m‑dot, hreflang, CSS e JavaScript, incluindo solicitações XHR.
Estes URLs podem ser encontrados rastreando e analisando páginas ou numa variedade de outras fontes, incluindo mapas de websites, feeds RSS, envio de URLs para indexação no Google Search Console ou usando a API de indexação.
Existem também vários Googlebots que partilham o orçamento de rastreio. Pode encontrar uma lista dos vários Googlebots que rastreiam o seu website, no relatório de estatísticas de rastreio no GSC.
Cada website terá um orçamento de rastreio diferente, composto por algumas entradas diferentes.
Procura de rastreio
A procura de rastreio é simplesmente quanto o Google deseja rastrear o seu website. Páginas mais populares e páginas que apresentam mudanças significativas serão mais rastreadas.
As páginas populares, ou aquelas com mais ligações, geralmente terão prioridade sobre as outras páginas. Lembre-se de que o Google deve priorizar as suas páginas para rastreio de alguma forma, e as ligações são uma maneira fácil de determinar quais as páginas mais populares do seu website. Não se trata apenas do seu website, mas de todas as páginas de todos os websites da Internet que o Google precisa de definir como privilegiar.
Pode usar o relatório Melhor por ligações no Explorador de Websites como uma indicação de quais as páginas que provavelmente serão rastreadas com maior frequência. Também mostra quando a Ahrefs rastreou as suas páginas pela última vez.
Também existe um conceito de desatualização. Se o Google perceber que uma página não está a mudar, será rastreada com menos frequência. Por exemplo, se rastrearem uma página e não virem alterações após um dia, podem esperar três dias antes de rastrear novamente, dez dias na próxima vez, 30 dias, 100 dias, etc. Não há um período real definido para esperar entre os rastreios, mas tornar-se‑á menos frequente com o tempo. No entanto, se o Google perceber grandes mudanças no website como um todo ou uma mudança de website, normalmente aumentarão a taxa de rastreio, pelo menos, temporariamente.
Limite de taxa de rastreio
O limite da taxa de rastreio é a quantidade de rastreios que o seu website pode suportar. Os websites têm uma certa quantidade de rastreios que podem ser realizados antes de terem problemas com a estabilidade do servidor, como lentidão ou erros. A maioria dos rastreadores desistirá do rastreio se começarem a identificar esses problemas, para que não prejudiquem o website.
O Google fará os ajustes com base na integridade de rastreio do website. Se o website estiver bem com mais rastreio, o limite aumentará. Se o website estiver com problemas, o Google diminuirá a taxa de rastreio.
Existem algumas coisas que pode fazer para garantir que o seu website ofereça suporte a rastreio adicional e aumente a procura de rastreio do seu website. Vejamos algumas dessas opções.
Acelere o seu servidor/aumente os recursos
A forma como o Google rastreia as páginas é basicamente fazer o download de recursos e, em seguida, processá-los. A velocidade da sua página, conforme o utilizador percebe, não é a mesma. O que afetará o orçamento de rastreio é a rapidez com que o Google se pode ligar e fazer download de recursos que têm mais a ver com o servidor e os recursos.
Mais ligações, externas e internas
Lembre-se de que a procura de rastreio geralmente é baseada em popularidade ou ligações. Pode aumentar o seu orçamento aumentando a quantidade de ligações externas e/ou ligações internas. As ligações internas são mais fáceis porque controla o website. Pode encontrar ligações internas sugeridas no relatório Oportunidades de ligações na Auditoria de websites, que também inclui um tutorial que explica como funciona.
Corrigir ligações quebradas e redirecionadas
Manter ativas ligações para página quebradas ou redirecionadas no seu website terá um pequeno impacto no orçamento de rastreio. Normalmente, as páginas ligadas aqui terão uma prioridade relativamente baixa porque provavelmente não mudam há algum tempo, mas a limpeza de quaisquer problemas é bom para a manutenção do website em geral e ajudará um pouco no orçamento de rastreio.
Pode encontrar links corrompidos (4xx) e redirecionados (3xx) no seu website facilmente no relatório de páginas internas na Auditoria de websites.
Para ligações quebradas ou redirecionadas no sitemap, verifique o relatório Todos os problemas para problemas de “redirecionamento 3XX no sitemap” e “página 4XX no sitemap”.
Use GET em vez de POST onde puder
Este é um pouco mais técnico, pois envolve métodos de pedido HTTP. Não use pedidos POST onde as solicitações GET funcionam. É basicamente GET (puxar) vs POST (empurrar). Os pedidos POST não são armazenados em cache, de modo que afetam o orçamento de rastreio, mas os pedidos GET podem ser armazenados em cache.
Use a API de Indexação
Se precisa que as páginas sejam rastreadas mais rapidamente, verifique se está qualificado para a API de indexação do Google. Atualmente, isto está disponível apenas para alguns casos de utilização, como anúncios de emprego ou vídeos ao vivo.
O Bing também possui uma API de indexação que está disponível para todos.
O que não vai funcionar
Existem algumas coisas que as pessoas às vezes tentam e que realmente não ajudam com o seu orçamento de rastreio.
- Pequenas mudanças no website. Fazer pequenas alterações nas páginas, como atualizar datas, espaços ou pontuação na esperança de que as páginas sejam rastreadas com mais frequência. O Google é muito bom em determinar se as mudanças são significativas ou não, portanto, essas pequenas mudanças provavelmente não terão impacto no rastreio.
- Diretiva de atraso de rastreamento em robots.txt. Esta diretiva tornará muitos bots mais lentos. No entanto, o Googlebot não o usa, por isso não terá impacto. Respeitamos isso na Ahrefs, portanto, se precisar de desacelerar o nosso rastreio, pode adicionar um atraso de rastreio no seu arquivo robots.txt.
- Remover scripts de terceiros. Scripts de terceiros não contam no seu orçamento de rastreio, portanto, removê-los não ajudará.
- Não siga. Ok, isto é duvidoso. No passado, as ligações nofollow não teriam usado o orçamento de rastreio. No entanto, nofollow agora é tratado como uma dica para que o Google possa optar por rastrear essas ligações.
Existem apenas algumas boas maneiras de tornar o rastreio do Google mais lento. Existem alguns outros ajustes que poderia fazer tecnicamente, como desacelerar o seu website, mas não são métodos que eu recomendaria.
Ajuste lento, mas garantido
O principal controlo que o Google nos dá para rastrear mais lentamente é um limitador de taxa no Google Search Console. Pode diminuir a taxa de rastreio com a ferramenta, mas pode levar até dois dias para entrar em vigor.
Ajuste rápido, mas com riscos
Se precisar de uma solução mais imediata, pode aproveitar os ajustes de taxa de rastreio do Google relacionados com a integridade do seu website. Se ligar ao Googlebot códigos de status ‘503 Serviço indisponível’ ou ‘429 Muitos pedidos’ nas páginas, estes começarão a rastrear mais lentamente ou poderão interromper o rastreio temporariamente. Não vai querer fazer isto por mais de alguns dias, ou eles podem começar a remover páginas do índice.
Pensamentos finais
Mais uma vez, quero reiterar que o orçamento de rastreio não é algo com que a maioria das pessoas se preocupe. Se tiver dúvidas, espero que este guia tenha sido útil.
Normalmente, só analiso isto quando há problemas com as páginas que não estão a ser rastreadas e indexadas, preciso explicar porque alguém não se deve preocupar com isso ou quando vejo algo que me preocupa no relatório de estatísticas de rastreio no Google Search Console.
Tem perguntas? Diga-me no Twitter.