Guía de SEO técnico para principiantes

Por Patrick Stox

SEO técnico en Ahrefs

El SEO técnico es la parte más importante del SEO... hasta que deja de serlo. Las páginas deben poder rastrearse e indexarse para tener siquiera una oportunidad de posicionar, pero muchas otras actividades tendrán un impacto mínimo en comparación con el contenido y los enlaces.

Escribimos esta guía para principiantes para ayudarte a entender algunos conceptos básicos y dónde conviene invertir tu tiempo para maximizar el impacto.


Parte 1

Conceptos básicos de SEO técnico

¿Qué es el SEO técnico?

El SEO técnico es la práctica de optimizar tu sitio web para ayudar a los motores de búsqueda a encontrar, rastrear, entender e indexar tus páginas. Ayuda a aumentar la visibilidad y las posiciones en los motores de búsqueda. También importa para la búsqueda con IA.

¿Qué tan complicado es el SEO técnico?

Depende. Los fundamentos no son realmente difíciles de dominar, pero el SEO técnico puede ser complejo y difícil de entender. Mantendré las cosas tan simples como pueda con esta guía.

¿Importa el SEO técnico para la búsqueda con IA?

Sí. La búsqueda con IA sigue dependiendo de páginas web rastreables, bien estructuradas y confiables. El SEO técnico garantiza que tu sitio sea rápido, accesible e indexable, lo que mejora las probabilidades de que tu contenido se use tanto en respuestas impulsadas por IA como en la búsqueda tradicional.


Parte 2

Comprender el Rastreo

En este capítulo, veremos cómo asegurarte de que los motores de búsqueda puedan rastrear tu contenido de forma eficiente.

Cómo funciona el rastreo

El Rastreo es cuando los motores de búsqueda recopilan contenido de las páginas y usan los enlaces que contienen para encontrar aún más páginas. Hay algunas maneras de controlar qué se rastrea en tu sitio web. Estas son algunas opciones.

Robots.txt

Un archivo robots.txt les dice a los motores de búsqueda y a las plataformas de IA por dónde pueden y por dónde no pueden ir en tu sitio.

La mayoría de los motores de búsqueda y rastreadores de IA respetan la configuración de tu robots.txt. Si se lo prohíbes explícitamente, lo obedecerán y no rastrearán tu contenido ni lo incluirán en datos de entrenamiento. Pero si bloqueas a los motores de búsqueda y a los LLM para que no usen tu sitio web como material de entrenamiento, también limitas tus posibilidades de ser visible en sus respuestas.

¿Sabías esto?

Google y algunos LLM pueden indexar páginas que no pueden rastrear si hay enlaces que apuntan a esas páginas. Esto puede ser confuso, pero si quieres evitar que las páginas se indexen, consulta esta guía y diagrama de flujo, que puede orientarte durante el proceso.

LLMs.txt

LLMs.txt es un estándar voluntario para indicar a los modelos de lenguaje grandes (LLM) cómo pueden usar tu contenido, pero, como explicamos en nuestra guía de LLMs.txt, no es especialmente eficaz y probablemente no valga el esfuerzo.

Todavía no hay pruebas de que LLMs.txt mejore la recuperación con IA, impulse el tráfico o mejore la precisión del modelo.

Frecuencia de rastreo

Hay una directiva crawl-delay que puedes usar en robots.txt y que muchos rastreadores admiten. Te permite establecer con qué frecuencia pueden rastrear páginas. Lamentablemente, Google no la respeta.[1] Para Google, tendrás que cambiar la frecuencia de rastreo en Google Search Console.[2]

Restricciones de acceso

Si quieres que la página sea accesible para algunos usuarios, pero no para los motores de búsqueda, entonces lo más probable es que necesites una de estas tres opciones:

  • Algún tipo de sistema de inicio de sesión
  • Autenticación HTTP (donde se requiere una contraseña para acceder)
  • Lista blanca de IP (que solo permite que direcciones IP específicas accedan a las páginas)

Este tipo de configuración es mejor para cosas como redes internas, contenido solo para miembros o para sitios de staging, prueba o desarrollo. Permite que un grupo de usuarios acceda a la página, pero los motores de búsqueda no podrán acceder a la página ni la indexarán.

Cómo ver la actividad de Rastreo

En el caso de Google específicamente, la forma más sencilla de ver qué está rastreando es con el informe de ”Estadísticas de rastreo” en Google Search Console, que te da más información sobre cómo está rastreando tu sitio web.

Si quieres ver toda la actividad de Rastreo en tu sitio web, incluida la de rastreadores de IA, tendrás que acceder a los registros de tu servidor y, posiblemente, usar una herramienta para analizar mejor los datos. Esto puede volverse bastante avanzado. Pero si tu hosting tiene un panel de control como cPanel, deberías tener acceso a los registros sin procesar y a algunos agregadores como AWstats y Webalizer.

Ajustes de Rastreo

Cada sitio web va a tener un presupuesto de rastreo diferente, que es una combinación de la frecuencia con la que Google quiere rastrear un sitio y cuánto rastreo permite tu sitio. Las páginas más populares y las que cambian a menudo se rastrearán con más frecuencia, y las páginas que no parecen ser populares o estar bien enlazadas se rastrearán con menos frecuencia.

Si los rastreadores ven señales de estrés mientras rastrean tu sitio web, normalmente reducirán la velocidad o incluso dejarán de rastrear hasta que las condiciones mejoren.

Después de que se rastrean las páginas, se renderizan y se envían al índice. El índice es la lista maestra de páginas que pueden devolverse para consultas de búsqueda. Hablemos del índice.


Parte 3

Comprender la indexación

En este capítulo, hablaremos sobre cómo asegurarte de que tus páginas estén indexadas y cómo comprobar cómo se indexan.

Directivas de robots

Una etiqueta meta robots es un fragmento de HTML que le indica a los motores de búsqueda cómo rastrear o indexar una página determinada. Se coloca en la sección <head> de una página web y se ve así:

<meta name="robots" content="noindex" />

Canonicalización

Cuando hay contenido duplicado que crea varias versiones de la misma página, Google seleccionará una para almacenarla en su índice. Este proceso se llama canonicalización y la URL seleccionada como canónica será la que Google muestre en los resultados de búsqueda. Hay muchas señales diferentes que usa para seleccionar la URL canónica, incluidas:

La forma más fácil de ver cómo Google ha indexado una página es usar la herramienta de inspección de URL en Google Search Console. Te mostrará la URL canónica seleccionada por Google.

Comprobar cómo se indexa una URL en Google Search Console

Parte 4

Victorias rápidas de SEO técnico

Una de las cosas más difíciles para los profesionales del SEO es la priorización. Hay muchas mejores prácticas, pero algunos cambios tendrán más impacto en tus posiciones y tráfico que otros. Aquí tienes algunos de los proyectos que recomendaría priorizar.

Comprobar la indexación

Asegúrate de que las páginas que quieres que la gente encuentre se puedan indexar en Google. Los dos capítulos anteriores trataban sobre Rastreo e indexación, y eso no fue casualidad.

Puedes consultar el informe Indexabilidad en Site Audit para encontrar páginas que no se pueden indexar y las razones. Es gratis en Ahrefs Webmaster Tools.

Encontrar páginas noindex en Site Audit de Ahrefs

Ejecuta una auditoría gratuita de SEO técnico

Si te registras aquí, obtendrás acceso a Ahrefs Webmaster Tools ↗ de forma gratuita

Recuperar enlaces perdidos

Los sitios web tienden a cambiar sus URLs con los años. En muchos casos, estas URLs antiguas tienen enlaces desde otros sitios web. Si no se redirigen a las páginas actuales, entonces esos enlaces se pierden y dejan de contar para tus páginas. No es demasiado tarde para hacer estas redirecciones y puedes recuperar rápidamente cualquier valor perdido. Piensa en esto como el Link Building más rápido que harás en tu vida.

Puedes encontrar oportunidades para recuperar enlaces perdidos usando Site Explorer de Ahrefs. Introduce tu dominio, ve al informe Mejores por enlaces y añade un filtro de respuesta HTTP "404 no encontrado". Normalmente ordeno esto por "Dominios de referencia".

Así es como se ve para 1800flowers.com:

Encontrar páginas 404 con Backlinks en Site Explorer de Ahrefs

Al mirar la primera URL en archive.org, veo que antes era la página del Día de la Madre. Al redirigir esa página a la versión actual, recuperarás 225 enlaces de 59 sitios web diferentes, y hay muchas más oportunidades.

Incluso creé un script para ayudarte a emparejar redirecciones. No te asustes; solo tienes que descargar un par de archivos y subirlos. El cuaderno de Colab te guía paso a paso y se encarga del trabajo pesado por ti.

Querrás hacer una Redirección 301 de cualquier URL antigua hacia sus ubicaciones actuales para recuperar este valor perdido.

¿Sabías esto?

Una Redirección 301 es una redirección permanente. Cualquier enlace que apunte a la URL redirigida contará para la nueva URL a los ojos de Google.[3]

Añadir enlaces internos

Enlaces internos son enlaces de una página de tu sitio a otra página de tu sitio. Ayudan a que se encuentren tus páginas y también a que posicionen mejor. Tenemos una herramienta en Site Audit llamada Internal Link Opportunities que te ayuda a localizar estas oportunidades rápidamente.

Esta herramienta funciona buscando menciones de palabras clave con las que ya te posicionas en tu sitio. Luego las sugiere como oportunidades contextuales de Enlaces internos.

Por ejemplo, la herramienta detecta una mención de “navegación facetada” en nuestra guía sobre contenido duplicado. Como Site Audit sabe que tenemos una página sobre navegación facetada, sugiere que añadamos un enlace interno a esa página.

Encontrar oportunidades de enlaces internos en Site Audit de Ahrefs

Añadir marcado Schema

Schema markup es código que ayuda a los motores de búsqueda a entender mejor tu contenido y habilita muchas funciones que pueden ayudar a que tu sitio web destaque en los resultados de búsqueda. También puede ayudar a los LLM a interpretar correctamente el contenido de tu página. Google tiene una galería de búsqueda que muestra las distintas funciones de búsqueda y el schema necesario para que tu sitio sea apto.


Parte 5

SEO técnico para la búsqueda con IA

La IA ha cambiado la forma en que se encuentra y se muestra el contenido a los buscadores, pero sigue dependiendo de una base de páginas web rastreables, bien estructuradas y confiables. También está cambiando cómo creamos y optimizamos contenido.

Prestar atención a algunos factores técnicos específicos de la IA puede ayudarte a mantenerte visible allí donde la gente busque información.

Haz que tu sitio sea accesible para los LLM

Al igual que los motores de búsqueda, los LLM necesitan poder rastrear tu sitio web y acceder a su contenido. Sin embargo, funcionan de forma un poco diferente a los rastreadores de motores de búsqueda.

Por ejemplo, la mayoría de los LLM no renderizan JavaScript, un lenguaje de programación común usado para crear sitios web. Si el contenido clave o la navegación solo aparece después de que carga JavaScript, existe el riesgo de que algunos rastreadores de IA no lo vean. Por eso, lo mejor es evitar usarlo para cualquier contenido crítico que quieras que sea visible en la búsqueda con IA.

También vale la pena comprobar si herramientas de terceros están bloqueando a los rastreadores de IA para que no accedan a tu sitio web.

Por ejemplo, Cloudflare introdujo nuevas funciones que permiten a los propietarios de sitios web controlar si las plataformas de IA pueden extraer contenido para sus conjuntos de datos de entrenamiento.

Configuración de Cloudflare para controlar el acceso de rastreadores de IA a tu sitio web

La configuración predeterminada impide que los rastreadores de IA accedan al contenido. Sin embargo, tendrás que desactivarla si quieres que tu contenido maximice tu visibilidad en los resultados de búsqueda con IA.

Redirigir URL alucinadas

Los sistemas de búsqueda con IA pueden citar URLs en tu dominio que no existen. Puedes descubrirlas en Web Analytics de Ahrefs mirando las páginas que reciben tráfico de búsqueda con IA:

Descubrir URL alucinadas en Web Analytics de Ahrefs

Si alguna de estas páginas devuelve un Error 404, es posible que el sistema de IA haya alucinado la URL. Para evitar perder tráfico, puedes redirigir esa URL a una página activa relevante.

La supervisión periódica evita la frustración de los usuarios y protege la autoridad de la marca.

Detección de contenido de IA

Aunque está bien usar IA para crear contenido para tu sitio web, demasiado contenido de IA puede considerarse una señal de spam que limite la visibilidad de tu contenido en sistemas de búsqueda tradicionales y de IA.

FAQ de Google sobre si el contenido de IA va en contra de las directrices de Búsqueda

Puedes usar el detector de IA de Ahrefs en Site Explorer > Page Inspect para ver cómo las máquinas pueden interpretar el nivel de IA utilizado en tu contenido.

Uso del detector de IA de Ahrefs en Site Explorer Page Inspect

También puedes comprobarlo en bloque en el informe Páginas principales para detectar páginas existentes que quizá deban reescribirse:

Comprobación en bloque de niveles de contenido de IA en el informe Páginas principales de Ahrefs

Código inyectado por herramientas de IA

Si has usado IA para ayudar a crear tu sitio web o añadir nuevas funciones, pueden agregar código HTML adicional que revela que se usó IA.

En un caso, un error de Yoast SEO insertó clases ocultas relacionadas con la IA en páginas, dejando claro a los motores de búsqueda que la IA había intervenido.

Ejemplo de código relacionado con la IA inyectado por un error de Yoast SEO

Si usas herramientas de IA para hacer cambios on-page, revisa el código fuente de tu sitio para asegurarte de que no se está añadiendo nada inesperado. Las “huellas” ocultas como esta se pueden evitar con revisiones de código periódicas y pruebas antes de publicar actualizaciones.


Parte 6

Proyectos adicionales de SEO técnico

Los proyectos de los que hablaremos en este capítulo son buenas cosas en las que centrarse, pero pueden requerir más trabajo y tener menos beneficio que los proyectos de "victoria rápida" de la parte anterior. Eso no significa que no debas hacerlos. Esto solo es para ayudarte a hacerte una idea de cómo priorizar varios proyectos.

Señales de experiencia de página

Estos son factores de posicionamiento menores, pero aun así son cosas que conviene revisar por el bien de tus usuarios. Abarcan aspectos del sitio web que impactan en la experiencia de usuario (UX).

Las señales de búsqueda de Google para la experiencia de página

Las señales de búsqueda de Google para la experiencia de página

https://ahrefs.com/blog/core-web-vitals/

Core Web Vitals

Core Web Vitals son las métricas de velocidad que forman parte de las señales de experiencia de página de Google que se usan para medir la experiencia de usuario. Las métricas miden la carga visual con Largest Contentful Paint (LCP), la estabilidad visual con Cumulative Layout Shift (CLS) y la interactividad con First Input Delay (FID).

HTTPS

HTTPS protege la comunicación entre tu navegador y el servidor de que sea interceptada y manipulada por atacantes. Esto proporciona confidencialidad, integridad y autenticación a la gran mayoría del tráfico WWW actual. Quieres que tus páginas carguen con HTTPS y no con HTTP.

Cualquier sitio web que muestre un icono de "candado" en la barra de direcciones está usando HTTPS.

Barra de direcciones del navegador que muestra un icono de candado para ahrefs.com, lo que indica una conexión HTTPS segura

Adaptabilidad para dispositivos móviles

En pocas palabras, esto comprueba si las páginas web se muestran correctamente y si las personas pueden usarlas fácilmente en dispositivos móviles.

¿Cómo sabes lo optimizado para móviles que está tu sitio? Revisa el informe "Usabilidad móvil" en Google Search Console.

Informe Mobile Usability de Google Search Console que muestra problemas como elementos en los que se puede hacer clic demasiado cerca entre sí y texto demasiado pequeño para leer

Este informe te indica si alguna de tus páginas tiene problemas de compatibilidad con dispositivos móviles.

Intersticiales

Los intersticiales impiden que el contenido se vea. Son ventanas emergentes que cubren el contenido principal y con las que los usuarios pueden tener que interactuar antes de que desaparezcan.

Hreflang — Para varios idiomas

Hreflang es un atributo HTML que se utiliza para especificar el idioma y la segmentación geográfica de una página web. Si tienes varias versiones de la misma página en diferentes idiomas, puedes usar la etiqueta hreflang para informar a motores de búsqueda como Google sobre estas variaciones. Esto les ayuda a mostrar la versión correcta a sus usuarios.

Ahrefs ahora ayuda a facilitar la implementación de hreflang con un gráfico visual de enlaces hreflang en Site Audit.

Ahrefs Site Audit mostrando un gráfico visual de enlaces hreflang con conexiones entre versiones de idioma de una página

Este gráfico de hreflang muestra todas las variantes de idioma de una página y destaca cualquier problema de configuración. Además, marca errores como códigos de idioma no válidos, falta de enlaces a sí misma y ausencia de etiquetas recíprocas, y ofrece indicaciones claras sobre cómo solucionarlos.

Mantenimiento general/salud del sitio web

Es poco probable que estas tareas tengan mucho impacto en tus posiciones, pero, por lo general, son buenas cosas que corregir para la experiencia de usuario.

Enlaces rotos

Los Enlaces rotos son enlaces en tu sitio que apuntan a recursos inexistentes. Pueden ser internos (es decir, a otras páginas de tu dominio) o externos (es decir, a páginas de otros dominios).

Puedes encontrar Enlaces rotos en tu sitio web rápidamente con Site Audit en el informe Links. Es gratis en Ahrefs Webmaster Tools.

Informe Links de Ahrefs Site Audit que muestra recuentos de enlaces internos, internos rotos, externos y externos rotos

Cadenas de redirecciones

Las cadenas de redirecciones son una serie de redirecciones que ocurren entre la URL inicial y la URL de destino.

Puedes encontrar rápidamente cadenas de redirección en tu sitio web con Site Audit en el informe Redirecciones. Es gratis en Ahrefs Webmaster Tools.

Informe Redirects de Ahrefs Site Audit que muestra redirecciones de URL internas, cadenas de redirección y bucles de redirección

Parte 7

Herramientas de SEO técnico

Estas herramientas te ayudan a mejorar los aspectos técnicos de tu sitio web.

Dashboard de resumen de Google Search Console que muestra un gráfico de rendimiento con Clics totales a lo largo del tiempo

Google Search Console (antes Google Webmaster Tools) es un servicio gratuito de Google que te ayuda a supervisar y solucionar problemas con la apariencia de tu sitio web en sus resultados de búsqueda.

Úsalo para encontrar y corregir errores técnicos, enviar sitemaps, ver problemas de datos estructurados y más.

Bing y Yandex tienen sus propias versiones, y Ahrefs también. Ahrefs Webmaster Tools es una herramienta gratuita que te ayudará a mejorar el rendimiento SEO de tu sitio web. Te permite:

  • Supervisa la salud SEO de tu sitio web.
  • Comprueba más de 100 problemas de SEO.
  • Visualiza todos tus backlinks.
  • Visualiza todas las palabras clave por las que estás posicionado.
  • Descubre cuánto tráfico reciben tus páginas.
  • Encuentra oportunidades de enlazado interno.

Es nuestra respuesta a las limitaciones de Google Search Console.

Resultados de Google Mobile-Friendly Test que muestran que una página se puede usar en dispositivos móviles

La prueba Mobile-Friendly Test de Google comprueba lo fácil que es para un visitante usar tu página en un dispositivo móvil. También identifica problemas específicos de usabilidad móvil como texto demasiado pequeño para leer, uso de plugins incompatibles, etc.

La prueba Mobile-Friendly Test muestra lo que Google ve cuando rastrea la página. También puedes usar la prueba Rich Results Test para ver el contenido que Google ve para escritorio o dispositivos móviles.

Panel Elements de Chrome DevTools inspeccionando una Etiqueta H1 en una página web

Chrome DevTools es la herramienta integrada de Chrome para depurar páginas web. Úsala para depurar problemas de velocidad de página, mejorar el rendimiento de renderizado de páginas web y más.

Desde el punto de vista del SEO técnico, tiene usos interminables.

Extensión del navegador Ahrefs SEO Toolbar que muestra métricas de dominio y de página, incluidas Domain Rating, Backlinks, palabras clave y Métricas web principales

La Barra de herramientas de SEO de Ahrefs es una extensión gratuita para Chrome y Firefox que proporciona datos de SEO útiles sobre las páginas y los sitios web que visitas.

Sus funciones gratuitas son:

  • Informe de SEO on-page
  • Rastreador de redirecciones con encabezados HTTP
  • Comprobador de enlaces rotos
  • Resaltador de enlaces
  • Posiciones en las SERP

Además, como usuario de Ahrefs, obtienes:

  • Métricas SEO para cada sitio y página que visites y para los resultados de búsqueda de Google
  • Métricas de palabras clave, como Volumen de búsqueda y Dificultad de palabra clave, directamente en la SERP
  • Exportación de resultados SERP
Google PageSpeed Insights mostrando una puntuación de rendimiento de 81 para una página web en escritorio

PageSpeed Insights analiza la velocidad de carga de tus páginas web. Además de la puntuación de rendimiento, también muestra recomendaciones aplicables para que las páginas carguen más rápido.

Puntos clave

  • Si tu contenido no está indexado, entonces no se encontrará en los motores de búsqueda.
  • Cuando algo está roto y afecta el tráfico de búsqueda, puede ser una prioridad corregirlo. Pero para la mayoría de los sitios, probablemente sea mejor dedicar tiempo a tu contenido y tus enlaces.
  • Muchos de los proyectos técnicos con mayor impacto se centran en la indexación o en los enlaces.
  • El SEO técnico sigue importando para la búsqueda con IA. Las páginas bien estructuradas y rastreables ayudan a los sistemas de IA a encontrar, comprender y mostrar tu contenido.

Referencias

  1. "Is a crawl-delay rule ignored by Googlebot?". Google Search Central. 21 de diciembre de 2017
  2. "Change Googlebot crawl rate". Google. Consultado el 9 de septiembre de 2022
  3. "Las redirecciones 30x ya no pierden PageRank". Gary Illyes. 26 de julio de 2016
Guía creada porPatrick Stox

Patrick Stox es Asesor de Producto, SEO técnico y Embajador de Marca en Ahrefs. Fue el autor principal del capítulo de SEO del Web Almanac 2021 y revisor del capítulo de SEO de 2022. También coescribió el SEO Book For Beginners de Ahrefs y fue el Editor de Revisión Técnica de The Art of SEO (4.ª edición). Es organizador del Triangle SEO Meetup, de la conferencia Tech SEO Connect, gestiona un grupo de Slack de SEO técnico y es moderador de /r/TechSEO en Reddit.

Domina el SEO paso a paso

/01

¿Cómo funcionan los motores de búsqueda?

Antes de empezar a aprender SEO, es necesario entender cómo funcionan los motores de búsqueda.

/02

Fundamentos de SEO

Aprende a preparar tu sitio web para el éxito en SEO y conoce los cuatro pilares principales del SEO.

/03

Keyword Research

El punto de partida del SEO es entender qué buscan tus clientes objetivo.

/04

Contenido de SEO

Aprende a crear contenido que se posicione en los motores de búsqueda.

/05

SEO On-Page

Aquí es donde optimizas tus páginas para ayudar a los motores de búsqueda a entenderlas.

/06

Link Building

Los enlaces son la forma en que los motores de búsqueda descubren nuevas páginas y evalúan su «autoridad». Es difícil posicionarse en términos competitivos sin enlaces.

/07

SEO técnico

Es importante asegurarse de que no hay errores técnicos que impidan a Google acceder a tu sitio web y comprenderlo.

/08

Qué Significa la IA para el SEO

No se puede hablar de SEO hoy en día sin mencionar la IA generativa.