Bots de Ahrefs

En Ahrefs, utilizamos dos rastreadores web principales, AhrefsBot y AhrefsSiteAudit, para respaldar nuestro conjunto de herramientas y servicios. El objetivo de nuestro rastreo es ayudar a los propietarios de sitios a mejorar su presencia en línea, al tiempo que minimizamos la carga en sus servidores y garantizamos un comportamiento de rastreo seguro y transparente.

Our bots

AhrefsBot

Cadena de agente de usuarioMozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)

Robots.txt
  • User-agent token in robots.txt:
    AhrefsBot
  • Obeys robots.txt: Yes

  • Obeys crawl delay: Yes


PropósitoPotencia la base de datos tanto de Ahrefs, una plataforma inteligente de marketing, como la de Yep, un motor de búsqueda independiente enfocado en la privacidad.

AhrefsSiteAudit

Cadena de agente de usuario de escritorioMozilla/5.0 (compatible; AhrefsSiteAudit/6.1; +http://ahrefs.com/robot/site-audit)

Cadena de agente de usuario móvilMozilla/5.0 (Linux; Android 13) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.5359.128 Mobile Safari/537.36 (compatible; AhrefsSiteAudit/6.1; +http://ahrefs.com/robot/site-audit)

Robots.txt
  • User-agent token in robots.txt:
    AhrefsSiteAudit
  • Obeys robots.txt: Yes by default (website owners can request to disobey robots.txt on their sites)

  • Obeys crawl delay: Yes by default (website owners can request to disobey crawl delay on their sites)


PropósitoAlimenta la herramienta Site Audit de Ahrefs. Los usuarios de Ahrefs pueden utilizar Site Audit para analizar sitios web y descubrir problemas de SEO técnico y SEO on-page.

Verificado por Cloudflare

Cloudflare, una empresa líder en seguridad y rendimiento web, reconoce a AhrefsBot y aAhrefsSiteAudit como bots "buenos" verificados.

IndexNow.org

Socio de IndexNow

Yep, un motor de búsqueda desarrollado por Ahrefs, es un participante oficial en el protocolo IndexNow, junto con otros motores de búsqueda importantes. Ayudamos a los propietarios de sitios web a notificarnos inmediatamente cuando el contenido se actualiza, lo que garantiza una indexación más oportuna y precisa.

Verification and IP lists

Direcciones IP

Rastrearemos desde rangos de IP públicas. Puedes extraer nuestras direcciones IP como rangos de IP o IP individuales. Encontrarás más información sobre cómo incluir nuestras IP en la lista blanca en el artículo de ayuda.

DNS inverso

El sufijo DNS inverso del nombre de host de las IP siempre es ahrefs.com o ahrefs.net.

Estado del sitio web

Puedes verificar el estado de tu sitio web tal como lo ven nuestros bots y comprobar si pueden rastrearlo:

/

Benefits for site owners

AhrefsBot indexa información precisa y actualizada sobre sitios web y sus contenidos, así como también indexa la forma en la que se enlazan entre sí. Estos datos son de gran utilidad y se pueden aprovechar de formas muy diversas:

  • AhrefsBot powers Yep—an independent, privacy-focused search engine. Being included in Yep’s index helps site owners reach a new audience.
  • AhrefsBot feeds data into Ahrefs toolset. Website owners can create a free Ahrefs webmaster account and verify domain ownership to unlock site analytics, including access to in-depth backlink data, website performance metrics, and content change monitoring. Ahrefs also offers a suite of free SEO tools that anyone can use without creating an account.
  • AhrefsSiteAudit powers our Site Audit tool. Site Audit checks websites for technical and on-page issues such as broken links, slow performance, security misconfigurations, and SEO pitfalls. By crawling and rendering pages, we help identify improvements that can boost visibility, loading speed, and overall user experience. Ahrefs also provides the option to run Site Audit for free on verified websites, helping site owners discover and fix technical issues, all without incurring any charges

Policies and commitments

Cumplimiento de robots.txt

Ambos bots respetan estrictamente el archivo robots.txt, tanto en las reglas de no permitir (disallow) como en las de permitir (allow), así como las directivas de retraso de rastreo. Solo los propietarios de sitios verificados pueden permitir que el rastreador AhrefsSiteAudit desobedezca al archivo robots.txt en su sitio para comprobar si existen problemas en las secciones del sitio donde normalmente no está permitido rastrear.

El retraso de rastreo se respeta estrictamente al solicitar páginas HTML para no sobrepasar los límites de velocidad establecidos. Sin embargo, no puede aplicarse al renderizar JavaScript. Cuando nuestros bots renderizan una página, podrían solicitar simultáneamente múltiples recursos (p. ej., imágenes, scripts, hojas de estilos), lo que puede generar más solicitudes en los registros del servidor de las permitidas por el retraso de rastreo. Este comportamiento simula la experiencia de un usuario real, ya que las páginas web modernas a menudo requieren la carga de múltiples recursos al instante para un correcto renderizado y funcionamiento.

Almacenamiento en caché de activos

Durante los rastreos, almacenamos en caché los archivos solicitados frecuentemente (imágenes, CSS, JS) para minimizar la obtención reiterada, lo que reduce el consumo de ancho de banda y la carga del servidor.

Gestión de la carga

Si encontramos códigos de estado distintos a 200, especialmente errores 4XX o 5XX, automáticamente reducimos nuestra velocidad de rastreo para ese sitio. Esto garantiza una carga mínima en los sitios que pueden estar experimentando interrupciones o sobrecargas del servidor.

Prácticas transparentes

Entendemos que es posible que los proveedores de hosting, redes de distribución de contenidos y plataformas CMS quieran gestionar cómo los bots interactúan con los sitios de sus clientes. Nuestras direcciones IP y cadenas de agente de usuario públicas te permiten a ti, o a tus proveedores, verificar rápidamente el tráfico legítimo de Ahrefs. Estamos comprometidos con la transparencia en nuestras actividades de rastreo para fomentar la confianza y la colaboración. Si tienes alguna duda, ponte en contacto con nosotros a través de [email protected] y haremos todo lo posible por ayudarte.

Controlling bots behavior

Ofrecemos opciones claras y sencillas para controlar nuestros bots:

A través de robots.txt

Para cambiar la frecuencia con la que AhrefsBot o AhrefsSiteAudit visitan tu sitio, especifica el retraso mínimo adecuado entre dos solicitudes consecutivas en tu archivo robots.txt:

User-agent: AhrefsBotCrawl-Delay: [value]

(Donde el valor del retraso de rastreo representa tiempo en segundos).

Si no deseas que AhrefsBot o AhrefsSiteAudit visite tu sitio o una parte de él, utiliza las directivas de desautorización:

User-agent: AhrefsBotDisallow: /path-to-disallow/

Ten en cuenta que AhrefsBot podría necesitar un tiempo para detectar los cambios en tu archivo robots.txt. Esta acción se realiza antes del próximo rastreo programado. Los propietarios de sitios verificados pueden permitir que el rastreador AhrefsSiteAudit desobedezca al archivo robots.txt en su sitio para comprobar si existen problemas en las secciones del sitio donde normalmente no está permitido rastrear.

Además, si tu archivo robots.txt contiene errores, nuestros bots no podrán reconocer tus comandos y seguirán rastreando tu sitio web de la misma forma que lo hacían antes. Obtén más información sobre robots.txt en www.robotstxt.org.

Conversión de códigos de estado distintos a 200 para reducir la velocidad de rastreo

Puedes reducir temporalmente la velocidad de rastreo de AhrefsBot. Puede ser útil en casos de interrupciones o cambios en la infraestructura, cuando es necesario disminuir la carga en el sitio. Para ello, puedes devolver códigos de estado HTTP 4XX o 5XX durante el tiempo que dure la interrupción o el mantenimiento. Nuestro bot detectará estos errores y reducirá automáticamente la frecuencia de rastreo.

Ajuste de las configuraciones de velocidad en Site Audit

El bot AhrefsSiteAudit previene una carga excesiva en los servidores de los sitios web limitando el rastreo a 30 URL por minuto como máximo. Si tienes un sitio web, puedes rastrear tus sitios a velocidades más elevadas si deseas conocer más rápido los problemas del sitio. Para ello, deberás verificar la propiedad en la herramienta Site Audit.

Ponte en contacto con nosotros

Si tienes alguna duda sobre nuestra frecuencia de rastreo o si detectas tráfico sospechoso que deseas confirmar, ponte en contacto con nosotros a través de [email protected]. Estamos aquí para ayudarte a aclarar y resolver cualquier problema.