Ahrefs ボット

Ahrefs では、当社のツールおよびサービスのサポートとして、 AhrefsBotAhrefsSiteAuditの 2 つの主要なウェブクローラーを運用しています。当社のクロールの目的は、サイト所有者がオンラインプレゼンスを改善するのに役立てることであり、サーバーへの負荷を最小限に抑え、安全で透明性のあるクローリングを保証します。

当社のボット

AhrefsBot

User-agent 文字列Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)

Robots.txt
  • Robots.txt のユーザーエージェントトークン:
    AhrefsBot
  • Robots.txt に従う:はい

  • クロール遅延に従う:はい


目的マーケティングインテリジェンスプラットフォームである Ahrefs、プライバシー重視の独立した検索エンジン Yep の両方のデータベースを強化します。

AhrefsSiteAudit

デスクトップ の user-agent ストリングMozilla/5.0 (compatible; AhrefsSiteAudit/6.1; +http://ahrefs.com/robot/site-audit)

これは robots.txt ファイルを尊重しますか?Mozilla/5.0 (Linux; Android 13) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.5359.128 Mobile Safari/537.36 (compatible; AhrefsSiteAudit/6.1; +http://ahrefs.com/robot/site-audit)

Robots.txt
  • Robots.txt のユーザーエージェントトークン:
    AhrefsSiteAudit
  • Robots.txt に従う:デフォルト設定ではい(ウェブサイト所有者は、自分のサイトで robots.txt に従わないようにリクエストできます)

  • クロール遅延に従う:デフォルト設定ではい(ウェブサイト所有者は、自分のサイトでクロール遅延に従わないようにリクエストできます)


目的Ahrefs のサイト監査ツールを強化します。Ahrefs ユーザーは、サイト監査を使用してウェブサイトを分析し、テクニカル SEO とオンページ SEO の問題を見つけることができます。

Cloudflare 検証済み

AhrefsBotAhrefsSiteAudit のどちらも、優れたウェブセキュリティおよびパフォーマンス企業である Cloudflare によって確認済みの「最適な」ボットとして認められています。

IndexNow.org

IndexNow パートナー

Ahrefs が開発した検索エンジンである Yep は、主要な検索エンジンと同様、 IndexNow プロトコルに公式に参加しています。コンテンツが更新された際に、ウェブサイト所有者が当社に瞬時に通知できるようにすることで、より迅速かつ正確なインデックスを保証します。

検証と IP リスト

IP アドレス

公開されている IP 範囲からクロールを行います。当社の IP アドレスを IP 範囲または個別の IP として取得できます。IP をホワイトリストに追加する方法については、ヘルプ記事をご覧ください

リバース DNS

strong はウェブサイトとそのコンテンツ、そしてそれらがどのようにリンクしているかに関する最新かつ正確な情報をインデックスします。このデータは非常に有用で、様々な形で活用できます。

Web サイトステータス

当社のボットが認識するウェブサイトの状態と、クロールが可能かどうかを確認できます。

/

サイト所有者のメリット

AhrefsBot はウェブサイトとそのコンテンツ、そしてそれらがどのようにリンクしているかに関する最新かつ正確な情報をインデックスします。このデータは非常に有用で、様々な形で活用できます。

  • AhrefsBot はプライバシー重視の独立した検索エンジン Yep を搭載しています。Yep のインデックスを利用できるので、サイト所有者は新しいオーディエンスにリーチすることができます。
  • AhrefsBot は Ahrefs ツールセットにデータを供給します。ウェブサイトの所有者は無料の Ahrefs ウェブマスターアカウントを作成してドメイン所有権を確認することで、被リンクデータ、ウェブサイトパフォーマンス測定、コンテンツ変更監視など、詳細なサイト分析にアクセスできるようになります。また、Ahrefs はアカウントを作成しなくても誰でも使用できる無料 SEO ツール群も提供しています。
  • AhrefsSiteAudit は、当社のサイト監査ツールをサポートしています。サイト監査はリンク切れ、処理速度の遅れ、セキュリティの誤設定、SEO の問題など技術的およびページ内の問題をチェックします。ページをクロールしてレンダリングすることで、可視性、読み込み速度、全体的なユーザーエクスペリエンスをブーストするための改善点を特定します。また、 Ahrefs は確認済みのウェブサイトに対し無料でサイト監査を実行するオプションを提供しており、サイト所有者が技術的な問題を発見・修正できるようサポートします。

ポリシーおよびコミットメント

Robots.txt に従う

両方のボットは disallowallow 規則、および crawl-delay ディレクティブに厳密に従います。確認済みのサイト所有者だけが AhrefsSiteAudit クローラーが通常クロールが許可されていないサイトセクションを調べるために robots.txt を無視できるようにすることができます。

HTML ページを要求する際、クロール遅延を厳守し、指定された速度制限を超えないようにしています。しかし、JavaScript のレンダリングの際はそれを守れません。当社のボットがページをレンダリングする際は、多数のアセット(画像、スクリプト、スタイルシート等)を同時に要求します。このため、サーバーログにはクロール遅延設定で認められているよりも頻繁な要求が記録されることがあります。この動作は、最新のウェブページでは適切なレンダリングと機能のために複数のリソースを同時に読み込むというリアルユーザーの体験を模倣するものです。

アセットをキャッシュする

クロール中、よくリクエストされるファイル(画像、CSS、JS)をキャッシュして重複する取得を最小限に抑え、帯域幅消費とサーバー負荷を軽減します。

負荷管理

200ステータスではないコード、特に 4xx または 5xx エラーに遭遇した場合、そのサイトのクロール速度を自動的に低下させます。これは、サイトへの障害や高いサーバー負荷を対するストレスを最小限に抑えるためです。

透明性のある慣行

当社は、ボットが顧客のサイトとどのようにやり取りするかをホスティングプロバイダー、CDN、CMS プラットフォームが管理したい場合があることを理解しています。公に利用可能な当社の IP アドレスとユーザーエージェント文字列を利用することで、ユーザーやサービスプロバイダーは、合法的な Ahrefsトラフィックであるか否かを迅速に検証できます。当社はクローリングについて透明性を持ちつつ、信頼と協力を高めるよう尽力しています。ご不明な点がある場合は、[email protected] までいつでもご連絡ください。

ボットの動作を制御する

明確でユーザーフレンドリーなオプションを提供し、ボットを制御します:

Robots.txt 経由

AhrefsBot または AhrefsSiteAudit がサイトを訪問する頻度を変更するには、robots.txt ファイルに連続するリクエスト間の許容できる最小の遅延を指定してください

User-agent: AhrefsBotCrawl-Delay: [value]

(ここでの Crawl-Delay の値は秒単位です。)

AhrefsBot または AhrefsSiteAudit にサイトまたは一部のセクションへの訪問を停止させたい場合、Disallow ディレクティブを使用してください。

User-agent: AhrefsBotDisallow: /path-to-disallow/

AhrefsBot が robots.txt ファイルの変更を検出するまでに少々時間を要することがあります。これは次回のクロールの前に行われます。確認されたサイト所有者は、サイト上で AhrefsSiteAudit クローラーが robots.txt に従わないよう設定することができるので、通常クロールが許可されていないサイトセクションの問題を調べることができます。

また、robots.txt にエラーが含まれていると、ボットはコマンドを認識できず、以前と同じようにウェブサイトのクロールを続けます。robots.txt の詳細については www.robotstxt.org をご覧ください。

200 ステータスではないコードを返すことでクロール速度を低下

一時的に AhrefsBot のクロール速度を低下させることができます。これは、サイトへの負荷を軽減したい場合や、インフラの変更がある場合に役立ちます。障害発生期間やメンテナンスの間、4xx や 5xx の HTTP ステータスコードを返すことで一時的にクロール速度を低下します。当社のボットはこれらのエラーを検出し、自動的に速度を落とします。

サイト監査の速度設定の調整

AhrefsSiteAudit ボットは、クロールを最大毎分 30 URL に制限することでウェブサイトサーバーへの過剰な負荷を防ぎます。ウェブサイト所有者は、サイトの問題をより迅速に知りたい場合、より高速でクロールすることが可能です。そのためには、サイト監査ツールで所有権を確認する必要があります。

お問い合わせ

クロールの頻度に関しご不明な点がある場合や、確認が必要な疑わしいトラフィックを見かけた場合は、[email protected] までご連絡ください。お客様の問題を明確にし、解決するようお手伝いいたします。