Ahrefs ボット

Ahrefs では、当社のツールおよびサービスのサポートとして、 AhrefsBotAhrefsSiteAuditの 2 つの主要なウェブクローラーを運用しています。当社のクロールの目的は、サイト所有者がオンラインプレゼンスを改善するのに役立てることであり、サーバーへの負荷を最小限に抑え、安全で透明性のあるクローリングを保証します。

Our bots

AhrefsBot

User-agent 文字列Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)

Robots.txt
  • User-agent token in robots.txt:
    AhrefsBot
  • Obeys robots.txt: Yes

  • Obeys crawl delay: Yes


目的マーケティングインテリジェンスプラットフォームである Ahrefs、プライバシー重視の独立した検索エンジン Yep の両方のデータベースを強化します。

AhrefsSiteAudit

デスクトップ の user-agent ストリングMozilla/5.0 (compatible; AhrefsSiteAudit/6.1; +http://ahrefs.com/robot/site-audit)

これは robots.txt ファイルを尊重しますか?Mozilla/5.0 (Linux; Android 13) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.5359.128 Mobile Safari/537.36 (compatible; AhrefsSiteAudit/6.1; +http://ahrefs.com/robot/site-audit)

Robots.txt
  • User-agent token in robots.txt:
    AhrefsSiteAudit
  • Obeys robots.txt: Yes by default (website owners can request to disobey robots.txt on their sites)

  • Obeys crawl delay: Yes by default (website owners can request to disobey crawl delay on their sites)


目的Ahrefs のサイト監査ツールを強化します。Ahrefs ユーザーは、サイト監査を使用してウェブサイトを分析し、テクニカル SEO とオンページ SEO の問題を見つけることができます。

Cloudflare 検証済み

AhrefsBotAhrefsSiteAudit のどちらも、優れたウェブセキュリティおよびパフォーマンス企業である Cloudflare によって確認済みの「最適な」ボットとして認められています。

IndexNow.org

IndexNow パートナー

Ahrefs が開発した検索エンジンである Yep は、主要な検索エンジンと同様、 IndexNow プロトコルに公式に参加しています。コンテンツが更新された際に、ウェブサイト所有者が当社に瞬時に通知できるようにすることで、より迅速かつ正確なインデックスを保証します。

Verification and IP lists

IP アドレス

公開されている IP 範囲からクロールを行います。当社の IP アドレスを IP 範囲または個別の IP として取得できます。IP をホワイトリストに追加する方法については、ヘルプ記事をご覧ください

リバース DNS

strong はウェブサイトとそのコンテンツ、そしてそれらがどのようにリンクしているかに関する最新かつ正確な情報をインデックスします。このデータは非常に有用で、様々な形で活用できます。

Web サイトステータス

当社のボットが認識するウェブサイトの状態と、クロールが可能かどうかを確認できます。

/

Benefits for site owners

AhrefsBot はウェブサイトとそのコンテンツ、そしてそれらがどのようにリンクしているかに関する最新かつ正確な情報をインデックスします。このデータは非常に有用で、様々な形で活用できます。

  • AhrefsBot powers Yep—an independent, privacy-focused search engine. Being included in Yep’s index helps site owners reach a new audience.
  • AhrefsBot feeds data into Ahrefs toolset. Website owners can create a free Ahrefs webmaster account and verify domain ownership to unlock site analytics, including access to in-depth backlink data, website performance metrics, and content change monitoring. Ahrefs also offers a suite of free SEO tools that anyone can use without creating an account.
  • AhrefsSiteAudit powers our Site Audit tool. Site Audit checks websites for technical and on-page issues such as broken links, slow performance, security misconfigurations, and SEO pitfalls. By crawling and rendering pages, we help identify improvements that can boost visibility, loading speed, and overall user experience. Ahrefs also provides the option to run Site Audit for free on verified websites, helping site owners discover and fix technical issues, all without incurring any charges

Policies and commitments

Robots.txt に従う

両方のボットは disallowallow 規則、および crawl-delay ディレクティブに厳密に従います。確認済みのサイト所有者だけが AhrefsSiteAudit クローラーが通常クロールが許可されていないサイトセクションを調べるために robots.txt を無視できるようにすることができます。

HTML ページを要求する際、クロール遅延を厳守し、指定された速度制限を超えないようにしています。しかし、JavaScript のレンダリングの際はそれを守れません。当社のボットがページをレンダリングする際は、多数のアセット(画像、スクリプト、スタイルシート等)を同時に要求します。このため、サーバーログにはクロール遅延設定で認められているよりも頻繁な要求が記録されることがあります。この動作は、最新のウェブページでは適切なレンダリングと機能のために複数のリソースを同時に読み込むというリアルユーザーの体験を模倣するものです。

アセットをキャッシュする

クロール中、よくリクエストされるファイル(画像、CSS、JS)をキャッシュして重複する取得を最小限に抑え、帯域幅消費とサーバー負荷を軽減します。

負荷管理

200ステータスではないコード、特に 4xx または 5xx エラーに遭遇した場合、そのサイトのクロール速度を自動的に低下させます。これは、サイトへの障害や高いサーバー負荷を対するストレスを最小限に抑えるためです。

透明性のある慣行

当社は、ボットが顧客のサイトとどのようにやり取りするかをホスティングプロバイダー、CDN、CMS プラットフォームが管理したい場合があることを理解しています。公に利用可能な当社の IP アドレスとユーザーエージェント文字列を利用することで、ユーザーやサービスプロバイダーは、合法的な Ahrefsトラフィックであるか否かを迅速に検証できます。当社はクローリングについて透明性を持ちつつ、信頼と協力を高めるよう尽力しています。ご不明な点がある場合は、[email protected] までいつでもご連絡ください。

Controlling bots behavior

明確でユーザーフレンドリーなオプションを提供し、ボットを制御します:

Robots.txt 経由

AhrefsBot または AhrefsSiteAudit がサイトを訪問する頻度を変更するには、robots.txt ファイルに連続するリクエスト間の許容できる最小の遅延を指定してください

User-agent: AhrefsBotCrawl-Delay: [value]

(ここでの Crawl-Delay の値は秒単位です。)

AhrefsBot または AhrefsSiteAudit にサイトまたは一部のセクションへの訪問を停止させたい場合、Disallow ディレクティブを使用してください。

User-agent: AhrefsBotDisallow: /path-to-disallow/

AhrefsBot が robots.txt ファイルの変更を検出するまでに少々時間を要することがあります。これは次回のクロールの前に行われます。確認されたサイト所有者は、サイト上で AhrefsSiteAudit クローラーが robots.txt に従わないよう設定することができるので、通常クロールが許可されていないサイトセクションの問題を調べることができます。

また、robots.txt にエラーが含まれていると、ボットはコマンドを認識できず、以前と同じようにウェブサイトのクロールを続けます。robots.txt の詳細については www.robotstxt.org をご覧ください。

200 ステータスではないコードを返すことでクロール速度を低下

一時的に AhrefsBot のクロール速度を低下させることができます。これは、サイトへの負荷を軽減したい場合や、インフラの変更がある場合に役立ちます。障害発生期間やメンテナンスの間、4xx や 5xx の HTTP ステータスコードを返すことで一時的にクロール速度を低下します。当社のボットはこれらのエラーを検出し、自動的に速度を落とします。

サイト監査の速度設定の調整

AhrefsSiteAudit ボットは、クロールを最大毎分 30 URL に制限することでウェブサイトサーバーへの過剰な負荷を防ぎます。ウェブサイト所有者は、サイトの問題をより迅速に知りたい場合、より高速でクロールすることが可能です。そのためには、サイト監査ツールで所有権を確認する必要があります。

お問い合わせ

クロールの頻度に関しご不明な点がある場合や、確認が必要な疑わしいトラフィックを見かけた場合は、[email protected] までご連絡ください。お客様の問題を明確にし、解決するようお手伝いいたします。