
Por Patrick Stox
SEO técnico en Ahrefs
El SEO técnico es la parte más importante del SEO... hasta que deja de serlo. Las páginas deben poder rastrearse e indexarse para tener siquiera una oportunidad de posicionar, pero muchas otras actividades tendrán un impacto mínimo en comparación con el contenido y los enlaces.
Escribimos esta guía para principiantes para ayudarte a entender algunos conceptos básicos y dónde conviene invertir tu tiempo para maximizar el impacto.
El SEO técnico es la práctica de optimizar tu sitio web para ayudar a los motores de búsqueda a encontrar, rastrear, entender e indexar tus páginas. Ayuda a aumentar la visibilidad y las posiciones en los motores de búsqueda. También importa para la búsqueda con IA.
Depende. Los fundamentos no son realmente difíciles de dominar, pero el SEO técnico puede ser complejo y difícil de entender. Mantendré las cosas tan simples como pueda con esta guía.
Sí. La búsqueda con IA sigue dependiendo de páginas web rastreables, bien estructuradas y confiables. El SEO técnico garantiza que tu sitio sea rápido, accesible e indexable, lo que mejora las probabilidades de que tu contenido se use tanto en respuestas impulsadas por IA como en la búsqueda tradicional.
En este capítulo, veremos cómo asegurarte de que los motores de búsqueda puedan rastrear tu contenido de forma eficiente.
El Rastreo es cuando los motores de búsqueda recopilan contenido de las páginas y usan los enlaces que contienen para encontrar aún más páginas. Hay algunas maneras de controlar qué se rastrea en tu sitio web. Estas son algunas opciones.
Un archivo robots.txt les dice a los motores de búsqueda y a las plataformas de IA por dónde pueden y por dónde no pueden ir en tu sitio.
La mayoría de los motores de búsqueda y rastreadores de IA respetan la configuración de tu robots.txt. Si se lo prohíbes explícitamente, lo obedecerán y no rastrearán tu contenido ni lo incluirán en datos de entrenamiento. Pero si bloqueas a los motores de búsqueda y a los LLM para que no usen tu sitio web como material de entrenamiento, también limitas tus posibilidades de ser visible en sus respuestas.
¿Sabías esto?
Google y algunos LLM pueden indexar páginas que no pueden rastrear si hay enlaces que apuntan a esas páginas. Esto puede ser confuso, pero si quieres evitar que las páginas se indexen, consulta esta guía y diagrama de flujo, que puede orientarte durante el proceso.
LLMs.txt es un estándar voluntario para indicar a los modelos de lenguaje grandes (LLM) cómo pueden usar tu contenido, pero, como explicamos en nuestra guía de LLMs.txt, no es especialmente eficaz y probablemente no valga el esfuerzo.
Todavía no hay pruebas de que LLMs.txt mejore la recuperación con IA, impulse el tráfico o mejore la precisión del modelo.
Si quieres que la página sea accesible para algunos usuarios, pero no para los motores de búsqueda, entonces lo más probable es que necesites una de estas tres opciones:
Este tipo de configuración es mejor para cosas como redes internas, contenido solo para miembros o para sitios de staging, prueba o desarrollo. Permite que un grupo de usuarios acceda a la página, pero los motores de búsqueda no podrán acceder a la página ni la indexarán.
En el caso de Google específicamente, la forma más sencilla de ver qué está rastreando es con el informe de ”Estadísticas de rastreo” en Google Search Console, que te da más información sobre cómo está rastreando tu sitio web.
Si quieres ver toda la actividad de Rastreo en tu sitio web, incluida la de rastreadores de IA, tendrás que acceder a los registros de tu servidor y, posiblemente, usar una herramienta para analizar mejor los datos. Esto puede volverse bastante avanzado. Pero si tu hosting tiene un panel de control como cPanel, deberías tener acceso a los registros sin procesar y a algunos agregadores como AWstats y Webalizer.
Cada sitio web va a tener un presupuesto de rastreo diferente, que es una combinación de la frecuencia con la que Google quiere rastrear un sitio y cuánto rastreo permite tu sitio. Las páginas más populares y las que cambian a menudo se rastrearán con más frecuencia, y las páginas que no parecen ser populares o estar bien enlazadas se rastrearán con menos frecuencia.
Si los rastreadores ven señales de estrés mientras rastrean tu sitio web, normalmente reducirán la velocidad o incluso dejarán de rastrear hasta que las condiciones mejoren.
Después de que se rastrean las páginas, se renderizan y se envían al índice. El índice es la lista maestra de páginas que pueden devolverse para consultas de búsqueda. Hablemos del índice.
En este capítulo, hablaremos sobre cómo asegurarte de que tus páginas estén indexadas y cómo comprobar cómo se indexan.
Una etiqueta meta robots es un fragmento de HTML que le indica a los motores de búsqueda cómo rastrear o indexar una página determinada. Se coloca en la sección <head> de una página web y se ve así:
<meta name="robots" content="noindex" />
Cuando hay contenido duplicado que crea varias versiones de la misma página, Google seleccionará una para almacenarla en su índice. Este proceso se llama canonicalización y la URL seleccionada como canónica será la que Google muestre en los resultados de búsqueda. Hay muchas señales diferentes que usa para seleccionar la URL canónica, incluidas:
La forma más fácil de ver cómo Google ha indexado una página es usar la herramienta de inspección de URL en Google Search Console. Te mostrará la URL canónica seleccionada por Google.

Una de las cosas más difíciles para los profesionales del SEO es la priorización. Hay muchas mejores prácticas, pero algunos cambios tendrán más impacto en tus posiciones y tráfico que otros. Aquí tienes algunos de los proyectos que recomendaría priorizar.
Asegúrate de que las páginas que quieres que la gente encuentre se puedan indexar en Google. Los dos capítulos anteriores trataban sobre Rastreo e indexación, y eso no fue casualidad.
Puedes consultar el informe Indexabilidad en Site Audit para encontrar páginas que no se pueden indexar y las razones. Es gratis en Ahrefs Webmaster Tools.

Ejecuta una auditoría gratuita de SEO técnico
Si te registras aquí, obtendrás acceso a Ahrefs Webmaster Tools ↗ de forma gratuita
Los sitios web tienden a cambiar sus URLs con los años. En muchos casos, estas URLs antiguas tienen enlaces desde otros sitios web. Si no se redirigen a las páginas actuales, entonces esos enlaces se pierden y dejan de contar para tus páginas. No es demasiado tarde para hacer estas redirecciones y puedes recuperar rápidamente cualquier valor perdido. Piensa en esto como el Link Building más rápido que harás en tu vida.
Puedes encontrar oportunidades para recuperar enlaces perdidos usando Site Explorer de Ahrefs. Introduce tu dominio, ve al informe Mejores por enlaces y añade un filtro de respuesta HTTP "404 no encontrado". Normalmente ordeno esto por "Dominios de referencia".
Así es como se ve para 1800flowers.com:

Al mirar la primera URL en archive.org, veo que antes era la página del Día de la Madre. Al redirigir esa página a la versión actual, recuperarás 225 enlaces de 59 sitios web diferentes, y hay muchas más oportunidades.
Incluso creé un script para ayudarte a emparejar redirecciones. No te asustes; solo tienes que descargar un par de archivos y subirlos. El cuaderno de Colab te guía paso a paso y se encarga del trabajo pesado por ti.
Querrás hacer una Redirección 301 de cualquier URL antigua hacia sus ubicaciones actuales para recuperar este valor perdido.
¿Sabías esto?
Una Redirección 301 es una redirección permanente. Cualquier enlace que apunte a la URL redirigida contará para la nueva URL a los ojos de Google.[3]
Enlaces internos son enlaces de una página de tu sitio a otra página de tu sitio. Ayudan a que se encuentren tus páginas y también a que posicionen mejor. Tenemos una herramienta en Site Audit llamada Internal Link Opportunities que te ayuda a localizar estas oportunidades rápidamente.
Esta herramienta funciona buscando menciones de palabras clave con las que ya te posicionas en tu sitio. Luego las sugiere como oportunidades contextuales de Enlaces internos.
Por ejemplo, la herramienta detecta una mención de “navegación facetada” en nuestra guía sobre contenido duplicado. Como Site Audit sabe que tenemos una página sobre navegación facetada, sugiere que añadamos un enlace interno a esa página.

Schema markup es código que ayuda a los motores de búsqueda a entender mejor tu contenido y habilita muchas funciones que pueden ayudar a que tu sitio web destaque en los resultados de búsqueda. También puede ayudar a los LLM a interpretar correctamente el contenido de tu página. Google tiene una galería de búsqueda que muestra las distintas funciones de búsqueda y el schema necesario para que tu sitio sea apto.
La IA ha cambiado la forma en que se encuentra y se muestra el contenido a los buscadores, pero sigue dependiendo de una base de páginas web rastreables, bien estructuradas y confiables. También está cambiando cómo creamos y optimizamos contenido.
Prestar atención a algunos factores técnicos específicos de la IA puede ayudarte a mantenerte visible allí donde la gente busque información.
Al igual que los motores de búsqueda, los LLM necesitan poder rastrear tu sitio web y acceder a su contenido. Sin embargo, funcionan de forma un poco diferente a los rastreadores de motores de búsqueda.
Por ejemplo, la mayoría de los LLM no renderizan JavaScript, un lenguaje de programación común usado para crear sitios web. Si el contenido clave o la navegación solo aparece después de que carga JavaScript, existe el riesgo de que algunos rastreadores de IA no lo vean. Por eso, lo mejor es evitar usarlo para cualquier contenido crítico que quieras que sea visible en la búsqueda con IA.
También vale la pena comprobar si herramientas de terceros están bloqueando a los rastreadores de IA para que no accedan a tu sitio web.
Por ejemplo, Cloudflare introdujo nuevas funciones que permiten a los propietarios de sitios web controlar si las plataformas de IA pueden extraer contenido para sus conjuntos de datos de entrenamiento.

La configuración predeterminada impide que los rastreadores de IA accedan al contenido. Sin embargo, tendrás que desactivarla si quieres que tu contenido maximice tu visibilidad en los resultados de búsqueda con IA.
Los sistemas de búsqueda con IA pueden citar URLs en tu dominio que no existen. Puedes descubrirlas en Web Analytics de Ahrefs mirando las páginas que reciben tráfico de búsqueda con IA:

Si alguna de estas páginas devuelve un Error 404, es posible que el sistema de IA haya alucinado la URL. Para evitar perder tráfico, puedes redirigir esa URL a una página activa relevante.
La supervisión periódica evita la frustración de los usuarios y protege la autoridad de la marca.
Aunque está bien usar IA para crear contenido para tu sitio web, demasiado contenido de IA puede considerarse una señal de spam que limite la visibilidad de tu contenido en sistemas de búsqueda tradicionales y de IA.

Puedes usar el detector de IA de Ahrefs en Site Explorer > Page Inspect para ver cómo las máquinas pueden interpretar el nivel de IA utilizado en tu contenido.

También puedes comprobarlo en bloque en el informe Páginas principales para detectar páginas existentes que quizá deban reescribirse:

Si has usado IA para ayudar a crear tu sitio web o añadir nuevas funciones, pueden agregar código HTML adicional que revela que se usó IA.
En un caso, un error de Yoast SEO insertó clases ocultas relacionadas con la IA en páginas, dejando claro a los motores de búsqueda que la IA había intervenido.

Si usas herramientas de IA para hacer cambios on-page, revisa el código fuente de tu sitio para asegurarte de que no se está añadiendo nada inesperado. Las “huellas” ocultas como esta se pueden evitar con revisiones de código periódicas y pruebas antes de publicar actualizaciones.
Los proyectos de los que hablaremos en este capítulo son buenas cosas en las que centrarse, pero pueden requerir más trabajo y tener menos beneficio que los proyectos de "victoria rápida" de la parte anterior. Eso no significa que no debas hacerlos. Esto solo es para ayudarte a hacerte una idea de cómo priorizar varios proyectos.
Estos son factores de posicionamiento menores, pero aun así son cosas que conviene revisar por el bien de tus usuarios. Abarcan aspectos del sitio web que impactan en la experiencia de usuario (UX).
Las señales de búsqueda de Google para la experiencia de página

https://ahrefs.com/blog/core-web-vitals/
Core Web Vitals son las métricas de velocidad que forman parte de las señales de experiencia de página de Google que se usan para medir la experiencia de usuario. Las métricas miden la carga visual con Largest Contentful Paint (LCP), la estabilidad visual con Cumulative Layout Shift (CLS) y la interactividad con First Input Delay (FID).
HTTPS protege la comunicación entre tu navegador y el servidor de que sea interceptada y manipulada por atacantes. Esto proporciona confidencialidad, integridad y autenticación a la gran mayoría del tráfico WWW actual. Quieres que tus páginas carguen con HTTPS y no con HTTP.
Cualquier sitio web que muestre un icono de "candado" en la barra de direcciones está usando HTTPS.

En pocas palabras, esto comprueba si las páginas web se muestran correctamente y si las personas pueden usarlas fácilmente en dispositivos móviles.
¿Cómo sabes lo optimizado para móviles que está tu sitio? Revisa el informe "Usabilidad móvil" en Google Search Console.

Este informe te indica si alguna de tus páginas tiene problemas de compatibilidad con dispositivos móviles.
Los intersticiales impiden que el contenido se vea. Son ventanas emergentes que cubren el contenido principal y con las que los usuarios pueden tener que interactuar antes de que desaparezcan.
Hreflang es un atributo HTML que se utiliza para especificar el idioma y la segmentación geográfica de una página web. Si tienes varias versiones de la misma página en diferentes idiomas, puedes usar la etiqueta hreflang para informar a motores de búsqueda como Google sobre estas variaciones. Esto les ayuda a mostrar la versión correcta a sus usuarios.
Ahrefs ahora ayuda a facilitar la implementación de hreflang con un gráfico visual de enlaces hreflang en Site Audit.

Este gráfico de hreflang muestra todas las variantes de idioma de una página y destaca cualquier problema de configuración. Además, marca errores como códigos de idioma no válidos, falta de enlaces a sí misma y ausencia de etiquetas recíprocas, y ofrece indicaciones claras sobre cómo solucionarlos.
Es poco probable que estas tareas tengan mucho impacto en tus posiciones, pero, por lo general, son buenas cosas que corregir para la experiencia de usuario.
Los Enlaces rotos son enlaces en tu sitio que apuntan a recursos inexistentes. Pueden ser internos (es decir, a otras páginas de tu dominio) o externos (es decir, a páginas de otros dominios).
Puedes encontrar Enlaces rotos en tu sitio web rápidamente con Site Audit en el informe Links. Es gratis en Ahrefs Webmaster Tools.

Las cadenas de redirecciones son una serie de redirecciones que ocurren entre la URL inicial y la URL de destino.
Puedes encontrar rápidamente cadenas de redirección en tu sitio web con Site Audit en el informe Redirecciones. Es gratis en Ahrefs Webmaster Tools.

Estas herramientas te ayudan a mejorar los aspectos técnicos de tu sitio web.

Google Search Console (antes Google Webmaster Tools) es un servicio gratuito de Google que te ayuda a supervisar y solucionar problemas con la apariencia de tu sitio web en sus resultados de búsqueda.
Úsalo para encontrar y corregir errores técnicos, enviar sitemaps, ver problemas de datos estructurados y más.
Bing y Yandex tienen sus propias versiones, y Ahrefs también. Ahrefs Webmaster Tools es una herramienta gratuita que te ayudará a mejorar el rendimiento SEO de tu sitio web. Te permite:
Es nuestra respuesta a las limitaciones de Google Search Console.

La prueba Mobile-Friendly Test de Google comprueba lo fácil que es para un visitante usar tu página en un dispositivo móvil. También identifica problemas específicos de usabilidad móvil como texto demasiado pequeño para leer, uso de plugins incompatibles, etc.
La prueba Mobile-Friendly Test muestra lo que Google ve cuando rastrea la página. También puedes usar la prueba Rich Results Test para ver el contenido que Google ve para escritorio o dispositivos móviles.

Chrome DevTools es la herramienta integrada de Chrome para depurar páginas web. Úsala para depurar problemas de velocidad de página, mejorar el rendimiento de renderizado de páginas web y más.
Desde el punto de vista del SEO técnico, tiene usos interminables.

La Barra de herramientas de SEO de Ahrefs es una extensión gratuita para Chrome y Firefox que proporciona datos de SEO útiles sobre las páginas y los sitios web que visitas.
Sus funciones gratuitas son:
Además, como usuario de Ahrefs, obtienes:

PageSpeed Insights analiza la velocidad de carga de tus páginas web. Además de la puntuación de rendimiento, también muestra recomendaciones aplicables para que las páginas carguen más rápido.

Patrick Stox es Asesor de Producto, SEO técnico y Embajador de Marca en Ahrefs. Fue el autor principal del capítulo de SEO del Web Almanac 2021 y revisor del capítulo de SEO de 2022. También coescribió el SEO Book For Beginners de Ahrefs y fue el Editor de Revisión Técnica de The Art of SEO (4.ª edición). Es organizador del Triangle SEO Meetup, de la conferencia Tech SEO Connect, gestiona un grupo de Slack de SEO técnico y es moderador de /r/TechSEO en Reddit.
Antes de empezar a aprender SEO, es necesario entender cómo funcionan los motores de búsqueda.
Aprende a preparar tu sitio web para el éxito en SEO y conoce los cuatro pilares principales del SEO.
El punto de partida del SEO es entender qué buscan tus clientes objetivo.
Aprende a crear contenido que se posicione en los motores de búsqueda.
Aquí es donde optimizas tus páginas para ayudar a los motores de búsqueda a entenderlas.
Los enlaces son la forma en que los motores de búsqueda descubren nuevas páginas y evalúan su «autoridad». Es difícil posicionarse en términos competitivos sin enlaces.
Es importante asegurarse de que no hay errores técnicos que impidan a Google acceder a tu sitio web y comprenderlo.
No se puede hablar de SEO hoy en día sin mencionar la IA generativa.