
Por Patrick Stox
SEO técnico na Ahrefs
O SEO técnico é a parte mais importante do SEO, até deixar de ser. As páginas precisam ser rastreáveis e indexáveis para terem alguma chance de se classificar, mas muitas outras atividades terão impacto mínimo em comparação com conteúdo e links.
Escrevemos este guia para iniciantes para ajudar você a entender alguns fundamentos e onde é melhor investir seu tempo para maximizar o impacto.
O SEO técnico é a prática de otimizar seu site para ajudar mecanismos de pesquisa a encontrar, rastrear, entender e indexar suas páginas. Ele ajuda a aumentar a visibilidade e o ranqueamento nos mecanismos de pesquisa. Ele também é importante para pesquisa com IA.
Depende. Os fundamentos não são tão difíceis de dominar, mas o SEO técnico pode ser complexo e difícil de entender. Vou manter as coisas o mais simples possível neste guia.
Sim. A pesquisa com IA ainda depende de páginas da web rastreáveis, bem estruturadas e confiáveis. O SEO técnico garante que seu site seja rápido, acessível e indexável, o que aumenta as chances de seu conteúdo ser usado em respostas orientadas por IA, além da pesquisa tradicional.
Neste capítulo, vamos abordar como garantir que os mecanismos de pesquisa consigam rastrear seu conteúdo com eficiência.
O rastreamento é quando os mecanismos de busca capturam conteúdo de páginas e usam os links nelas para encontrar ainda mais páginas. Há algumas maneiras de controlar o que é rastreado no seu site. Aqui estão algumas opções.
Um arquivo robots.txt diz aos mecanismos de pesquisa e às plataformas de IA onde eles podem e onde não podem ir no seu site.
A maioria dos mecanismos de pesquisa e rastreadores de IA respeita suas configurações de robots.txt. Se você os proibir explicitamente, eles vão obedecer e não vão rastrear seu conteúdo nem incluí-lo em dados de treinamento. Mas, se você impedir que mecanismos de pesquisa e LLMs usem seu site como material de treinamento, você também limita suas chances de ficar visível nas respostas deles.
Você sabia?
O Google e alguns LLMs podem indexar páginas que não conseguem rastrear se houver links apontando para essas páginas. Isso pode ser confuso, mas se você quiser impedir que páginas sejam indexadas, confira este guia e fluxograma, que pode orientar você pelo processo.
LLMs.txt é um standard voluntário para dizer a modelos de linguagem grandes (LLMs) como eles podem usar seu conteúdo, mas, como explicamos em nosso guia de LLMs.txt, ele não é especialmente eficaz e provavelmente não vale o esforço.
Ainda não há evidências de que o LLMs.txt melhore a recuperação por IA, aumente o tráfego ou melhore a precisão do modelo.
Há uma diretiva de crawl-delay que você pode usar no robots.txt que muitos rastreadores suportam. Ela permite definir com que frequência eles podem rastrear páginas. Infelizmente, o Google não respeita isso.[1] Para o Google, você precisará alterar a taxa de rastreamento no Google Search Console.[2]
Se você quer que a página seja acessível para alguns usuários, mas não para mecanismos de busca, então o que você provavelmente quer é uma destas três opções:
Esse tipo de configuração é melhor para coisas como redes internas, conteúdo apenas para membros, ou para sites de staging, teste ou desenvolvimento. Ela permite que um grupo de usuários acesse a página, mas os mecanismos de busca não conseguirão acessar a página e não a indexarão.
Especificamente para o Google, a forma mais fácil de ver o que ele está rastreando é com o relatório "Estatísticas de rastreamento" no Google Search Console, que fornece mais informações sobre como ele rastreia seu site.
Se você quiser ver toda a atividade de Rastreamento no seu site, incluindo de rastreadores de IA, será preciso acessar os logs do seu servidor e talvez usar uma ferramenta para analisar melhor os dados. Isso pode ficar bem avançado. Mas, se a sua hospedagem tiver um painel de controle como o cPanel, você deve ter acesso aos logs brutos e a alguns agregadores como AWstats e Webalizer.
Cada site terá um crawl budget diferente, que é a combinação da frequência com que o Google quer rastrear um site e do quanto o seu site permite esse rastreamento. Páginas mais populares e páginas que mudam com frequência serão rastreadas com mais frequência, e páginas que não parecem ser populares ou bem linkadas serão rastreadas com menos frequência.
Se os rastreadores perceberem sinais de sobrecarga enquanto rastreiam seu site, eles normalmente vão desacelerar ou até parar de rastrear até que as condições melhorem.
Depois que as páginas são rastreadas, elas são renderizadas e enviadas para o índice. O índice é a lista mestre de páginas que podem ser retornadas para consultas de pesquisa. Vamos falar sobre o índice.
Neste capítulo, vamos falar sobre como garantir que suas páginas sejam indexadas e verificar como elas estão indexadas.
Uma meta tag robots é um trecho de HTML que diz aos mecanismos de pesquisa como rastrear ou indexar uma determinada página. Ela é inserida na seção <head> de uma página da web e se parece com isto:
<meta name="robots" content="noindex" />
Quando há conteúdo duplicado criando várias versões da mesma página, o Google selecionará uma para armazenar no índice. Esse processo é chamado de canonicalização, e a URL selecionada como canônica será a que o Google mostra nos resultados de pesquisa. Há muitos sinais diferentes que ele usa para selecionar a URL canônica, incluindo:
A maneira mais fácil de ver como o Google indexou uma página é usar a ferramenta de inspeção de URL no Google Search Console. Ela mostrará a URL canônica selecionada pelo Google.

Uma das coisas mais difíceis para profissionais de SEO é priorização. Existem muitas boas práticas, mas algumas mudanças terão mais impacto no seu ranqueamento e tráfego do que outras. Aqui estão alguns dos projetos que eu recomendaria priorizar.
Garanta que as páginas que você quer que as pessoas encontrem possam ser indexadas no Google. Os dois capítulos anteriores foram totalmente sobre rastreamento e indexação, e isso não foi por acaso.
Você pode verificar o relatório Indexabilidade no Site Audit para encontrar páginas que não podem ser indexadas e os motivos. É gratuito no Ahrefs Webmaster Tools.

Execute uma auditoria gratuita de SEO técnico
Ao se inscrever aqui, você tem acesso gratuito às Ahrefs Webmaster Tools ↗
Os sites tendem a mudar suas URLs ao longo dos anos. Em muitos casos, essas URLs antigas têm links de outros sites. Se elas não forem redirecionadas para as páginas atuais, então esses links são perdidos e deixam de contar para as suas páginas. Ainda dá tempo de fazer esses redirects, e você pode recuperar rapidamente qualquer valor perdido. Pense nisso como o Link Building mais rápido que você vai fazer na vida.
Você pode encontrar oportunidades para recuperar links perdidos usando o Site Explorer da Ahrefs. Insira seu domínio, vá ao relatório Principais por links e adicione um filtro de resposta HTTP ”404 not found”. Eu costumo ordenar por ”Domínios de referência”.
É assim que fica para 1800flowers.com:

Olhando a primeira URL no archive.org, vejo que antes esta era a página de Dia das Mães. Ao redirecionar essa única página para a versão atual, você vai recuperar 225 links de 59 sites diferentes — e há muitas outras oportunidades.
Eu até criei um script para ajudar você a corresponder redirecionamentos. Não se assuste; você só precisa baixar alguns arquivos e enviá-los. O notebook do Colab guia você no processo e faz a parte pesada por você.
Você vai querer fazer um Redirect 301 de quaisquer URLs antigas para seus locais atuais para recuperar esse valor perdido.
Você sabia?
Um redirect 301 é um redirecionamento permanente. Quaisquer links que apontem para a URL redirecionada passarão a contar para a nova URL aos olhos do Google.[3]
Links internos são links de uma página do seu site para outra página do seu site. Eles ajudam suas páginas a serem encontradas e também ajudam as páginas a se classificarem melhor. Temos uma ferramenta dentro do Site Audit chamada Oportunidades de links internos que ajuda você a localizar rapidamente essas oportunidades.
Essa ferramenta funciona procurando menções de palavras-chave para as quais você já tem boa classificação no seu site. Em seguida, ela as sugere como oportunidades de links internos contextuais.
Por exemplo, a ferramenta mostra uma menção de "navegação facetada" em nosso guia sobre conteúdo duplicado. Como o Site Audit sabe que temos uma página sobre navegação facetada, ele sugere que adicionemos um link interno para essa página.

Marcação schema é um código que ajuda os mecanismos de busca a entender melhor seu conteúdo e viabiliza muitos recursos que podem ajudar seu site a se destacar nos resultados de pesquisa. Também pode ajudar LLMs a interpretar corretamente o conteúdo da sua página. O Google tem uma galeria de pesquisa que mostra os diversos recursos de pesquisa e o schema necessário para que seu site seja elegível.
A IA mudou como o conteúdo é encontrado e exibido para quem pesquisa, mas ainda depende de uma base de páginas da web rastreáveis, bem estruturadas e confiáveis. Ela também está mudando como criamos e otimizamos conteúdo.
Prestar atenção a alguns fatores técnicos específicos de IA pode ajudar você a continuar visível onde quer que as pessoas pesquisem informações.
Assim como os mecanismos de pesquisa, os LLMs precisam ser capazes de rastrear seu site e acessar o conteúdo. No entanto, eles funcionam de forma um pouco diferente dos rastreadores de mecanismos de pesquisa.
Por exemplo, a maioria dos LLMs não renderiza JavaScript, uma linguagem de programação comum usada para criar sites. Se conteúdo principal ou navegação só aparecer depois que o JavaScript carregar, existe o risco de alguns rastreadores de IA não verem isso. Então, o melhor é evitar usar JavaScript em qualquer conteúdo crítico que você quer visível na pesquisa com IA.
Também vale a pena verificar se ferramentas de terceiros estão bloqueando rastreadores de IA de acessarem seu site.
Por exemplo, a Cloudflare introduziu novos recursos que permitem que donos de sites controlem se plataformas de IA podem coletar conteúdo para seus conjuntos de dados de treinamento.

A configuração padrão bloqueia rastreadores de IA de acessarem o conteúdo. No entanto, você precisará desativá-la se quiser que seu conteúdo maximize sua visibilidade em resultados de pesquisa com IA.
Sistemas de pesquisa com IA podem citar URLs no seu domínio que não existem. Você pode descobrir isso no Web Analytics da Ahrefs olhando as páginas que recebem tráfego de pesquisa com IA:

Se alguma dessas páginas retornar um Erro 404, o sistema de IA pode ter alucinado a URL. Para evitar perder tráfego, você pode redirecionar essa URL para uma página ativa relevante.
O monitoramento regular evita frustração do usuário e protege a autoridade da marca.
Embora seja ok usar IA para criar conteúdo para o seu site, conteúdo demais gerado por IA pode ser visto como um sinal de spam que limita a visibilidade do seu conteúdo em sistemas de pesquisa tradicionais e com IA.

Você pode usar o detector de IA da Ahrefs em Site Explorer > Page Inspect para ver como as máquinas podem interpretar o nível de IA usado no seu conteúdo.

Você também pode verificar isso em massa no relatório Principais páginas para identificar páginas existentes que podem precisar ser reescritas:

Se você usou IA para ajudar a criar seu site ou adicionar novos recursos a ele, ela pode adicionar código HTML extra que revela que IA foi usada.
Em um caso, um bug do Yoast SEO inseriu classes ocultas relacionadas a IA nas páginas, deixando óbvio para os mecanismos de busca que a IA estava envolvida.

Se você usar ferramentas de IA para fazer mudanças on-page, verifique o código-fonte do seu site para garantir que nada inesperado esteja sendo adicionado. "Fingerprints" ocultas como essa podem ser evitadas com revisões regulares de código e testes antes de publicar atualizações.
Os projetos sobre os quais falaremos neste capítulo são todos boas coisas para focar, mas podem exigir mais trabalho e trazer menos benefício do que os projetos de "vitória rápida" da parte anterior. Isso não significa que você não deva fazê-los. É apenas para ajudar você a ter uma ideia de como priorizar os vários projetos.
Esses são fatores de classificação menos importantes, mas ainda assim são coisas que vale a pena observar pelo bem dos seus usuários. Eles abrangem aspectos do site que impactam a experiência do usuário (UX).
Sinais de pesquisa do Google para a experiência da página

https://ahrefs.com/blog/core-web-vitals/
Core Web Vitals são as métricas de velocidade que fazem parte dos sinais de Experiência da página do Google usados para medir a experiência do usuário. As métricas medem o carregamento visual com Largest Contentful Paint (LCP), a estabilidade visual com Cumulative Layout Shift (CLS) e a interatividade com First Input Delay (FID).
HTTPS protege a comunicação entre seu navegador e o servidor contra interceptação e adulteração por atacantes. Isso fornece confidencialidade, integridade e autenticação para a grande maioria do tráfego WWW de hoje. Você deve carregar suas páginas em HTTPS e não em HTTP.
Qualquer site que mostre um ícone de “cadeado” na barra de endereço está usando HTTPS.

Em resumo, isso verifica se as páginas da web são exibidas corretamente e podem ser usadas com facilidade por pessoas em dispositivos móveis.
Como você sabe o quão compatível com dispositivos móveis o seu site é? Verifique o Relatório “Usabilidade em dispositivos móveis” no Google Search Console.

Este relatório informa se alguma das suas páginas tem problemas de compatibilidade com dispositivos móveis.
Interstitials impedem que o conteúdo seja visto. São pop-ups que abrangem o conteúdo principal e com os quais os usuários talvez precisem interagir antes que desapareçam.
Hreflang é um atributo HTML usado para especificar o idioma e o direcionamento geográfico de uma página da web. Se você tiver várias versões da mesma página em diferentes idiomas, poderá usar a tag hreflang para informar mecanismos de busca como o Google sobre essas variações. Isso ajuda a servir a versão correta para os usuários.
Agora, a Ahrefs ajuda a tornar a implementação de hreflang mais fácil com um gráfico visual de links hreflang no Site Audit.

Este gráfico de hreflang mostra todas as variantes de idioma de uma página e destaca quaisquer problemas de configuração. Além disso, ele sinaliza erros como códigos de idioma inválidos, a ausência de links para si mesmo e a falta de tags recíprocas, e oferece orientações claras sobre como corrigi-los.
É pouco provável que essas tarefas tenham grande impacto no seu ranqueamento, mas, em geral, são coisas boas de corrigir para a experiência do usuário.
Links desfeitos são links no seu site que apontam para recursos que não existem. Eles podem ser internos (ou seja, para outras páginas do seu domínio) ou externos (ou seja, para páginas em outros domínios).
Você pode encontrar links desfeitos no seu site rapidamente com o Site Audit no relatório Links. É gratuito no Ahrefs Webmaster Tools.

Cadeias de redirecionamento são uma série de redirecionamentos que acontecem entre a URL inicial e a URL de destino.
Você pode encontrar cadeias de redirects no seu site rapidamente com o Site Audit no relatório Redirects. É grátis no Ahrefs Webmaster Tools.

Essas ferramentas ajudam você a melhorar os aspectos técnicos do seu site.

O Google Search Console (anteriormente Google Webmaster Tools) é um serviço gratuito do Google que ajuda você a monitorar e solucionar problemas de como seu site aparece nos resultados de pesquisa.
Use-o para encontrar e corrigir erros técnicos, enviar sitemaps, ver problemas de dados estruturados e muito mais.
Bing e Yandex têm suas próprias versões, e a Ahrefs também. O Ahrefs Webmaster Tools é uma ferramenta gratuita que ajuda você a melhorar o desempenho de SEO do seu site. Ela permite que você:
Essa é a nossa resposta às limitações do Google Search Console.

O Mobile-Friendly Test do Google verifica como é fácil para um visitante usar sua página em um dispositivo móvel. Ele também identifica problemas específicos de usabilidade em dispositivos móveis, como texto pequeno demais para ler, uso de plugins incompatíveis e assim por diante.
O Mobile-Friendly Test mostra o que o Google vê quando rastreia a página. Você também pode usar o Rich Results Test para ver o conteúdo que o Google vê para desktop ou dispositivos móveis.

O Chrome DevTools é a ferramenta integrada do Chrome para depurar páginas da web. Use-a para depurar problemas de velocidade da página, melhorar o desempenho de renderização de páginas da web e muito mais.
Do ponto de vista de SEO técnico, isso tem usos infinitos.

A barra de ferramentas de SEO da Ahrefs é uma extensão gratuita para Chrome e Firefox que fornece dados úteis de SEO sobre as páginas e sites que você visita.
Os recursos gratuitos são:
Além disso, como usuário da Ahrefs, você tem:

O PageSpeed Insights analisa a velocidade de carregamento das suas páginas da web. Além da pontuação de desempenho, ele também mostra recomendações acionáveis para fazer as páginas carregarem mais rápido.

Patrick Stox é consultor de produtor, SEO técnico e embaixador da marca na Ahrefs. Ele foi o autor principal do capítulo de SEO do Web Almanac 2021 e revisor do capítulo de SEO 2022. Ele também foi coautor do SEO Book For Beginners da Ahrefs e foi o editor de revisão técnica do livro The Art of SEO (4ª edição). Ele é organizador do Triangle SEO Meetup, da conferência Tech SEO Connect, administra um grupo Technical SEO Slack e é moderador do /r/TechSEO no Reddit.
Antes de começar a aprender sobre SEO, você precisa entender como funcionam os motores de busca.
Aprenda como configurar o seu site para um SEO de sucesso, e familiarize-se com as quatro principais facetas do SEO.
O primeiro passo no SEO é compreender o que seu público-alvo está pesquisando.
Aprenda a criar conteúdo ranqueador nos motores de busca.
Ao otimizar suas páginas, você ajuda os mecanismos de pesquisa a entendê-las.
Os motores de busca usam os links para descobrirem novas páginas e julgar a sua "autoridade". É difícil obter ranqueamento para termos competitivos sem links.
É importante certificar-se de que não existem falhas técnicas que impeçam o Google de acessar e compreender seu site.
Não se pode falar de SEO atualmente sem mencionar IA gerativa.