データ・研究

Ahrefs の検索トラフィック推定の精度はどのくらいか?(最新の調査)

Tim Soulo
Ahrefs の CMO。デジタルマーケティング業界で 15 年以上の経験を持ち、データドリブンな調査レポートや実践的なマーケティングフレームワークを多数発表。その一部は業界全体から注目を集めた実績を持つ。既存のマーケティング常識に疑問を投げかけ、シンプルさと効率的な方法を追求することを得意としている。
Ahrefs の最も一般的なユースケースの一つは、特定のウェブサイト(またはウェブページ)が獲得しているオーガニック検索トラフィック量を確認することです。

Ahrefs の検索トラフィックの数値はあくまでも推定値であることは広く知られています。しかし、実際のトラフィック数とどの程度乖離しているのでしょうか?

私たちは小規模な調査を行い、それを数値化してみることにしました。

調査結果を共有する前に、まず Ahrefs のトラフィック推定がどのように計算されているかを理解していただくことが非常に重要だと考えています。 

要約すると、以下のようなプロセスになります:

  1. ウェブサイトがランクインしているすべてのキーワードを抽出する
  2. 各キーワードの月間検索ボリュームを取得する
  3. 各キーワードにおけるそのウェブサイトの検索順位を調べる
  4. 各検索スニペットの CTR(クリック率)を予測する
  5. 各キーワードからのクリック数を合算し、推定される月間総検索トラフィックを算出する

どのステップで乖離が生じ始めているか分かりますか?(ヒント:すべてのステップです)

  • キーワード – 特定のウェブサイトがランクインしているすべてのキーワードを把握することは、実質的に不可能です。
  • 月間検索ボリューム – これらも特別に正確というわけではありません。 
  • 検索順位 – SERPs(検索結果画面)は非常に不安定です。今日、あなたのページが 3 位であっても、翌日には 4 位になるかもしれません。 
  • CTRSERP 上のページの CTR を予測するのは非常に困難です。検索意図、広告、AI による概要(AI Overviews)などの SERP フィーチャー、ブランド親和性など、考慮すべき要素が多すぎます。

ご覧の通り、弊社(あるいは他の SEO ツール)が検索トラフィック推定の計算に使用するデータには、修正がほぼ不可能な問題が数多くあります。そして、これらの問題は必然的に、算出されるトラフィック推定の質に影響を与えます。

弊社のトラフィック推定値は実際のデータからかなり乖離する場合もありますが、それでも、あらゆる種類のデジタルマーケティング専門家にとって計り知れない価値があるほど十分に優れています。

特に、その算出方法を理解していればなおさらです(今のあなたならすでにご存じのとおり)。そうすれば、データを活用する際にある程度のズレを織り込めるからです。詳しくは後述します。

では、いよいよ調査結果を見ていきましょう。

この調査は、Author­i­ty­Hack­er の皆さんに触発されたものです。彼らは最近、6 つの異なる SEO ツールによる検索トラフィック推定の質を比較する調査を実施しました。

その調査では、Ahrefs が勝者となりました(平均乖離率 22.5%、GSC データとの相関 0.99)。

Authority Hacker の調査結果(Ahrefs がトップ)

しかし、その調査はわずか 50 サイトという小規模なサンプルで行われたものでした。そこで、私たちはより大規模に再現し、数値がどのように変化するかを確認することにしました。

今回の調査では、1,635 のウェブサイトをランダムに抽出し、米国内の月間 GSC(Google Search Console)トラフィックと Ahrefs の米国内月間オーガニックトラフィック推定値を比較しました。 

私たちは同じ 2 つの要素を調査しました: 

  1. Ahrefs のトラフィック推定が GSC とどの程度乖離しているか 
  2. GSC と比較した場合、弊社のトラフィック推定にどの程度の整合性があるか

乖離

評価結果は、調査対象とした 1,635 サイトのサンプルにおいて、乖離率の中央値は 49.52% でした。 

言い換えれば、多くの場合、Ahrefs によるウェブサイトの米国内トラフィック報告は、実際の数値の最大半分程度の誤差があると考えておくのが妥当です。

これは大きく感じられるかもしれません。しかし実際には、誤差の範囲はウェブサイトの種類や業界に大きく依存します。一部のサイトでは誤差が 5% 未満である一方、他のサイトでは 1,000% を超えることもあります。 

しかし、ほとんどの場合、弊社の推定値はかなり良好です:

Ahrefs のトラフィック推定値と GSC の中央値の差は 49.52%

弊社の中央乖離率 49.52% を客観的に見るために、SEMrush でも計算したところ、68.36% となりました。 

整合性

トラフィック推定の「整合性」とは、以下のことを指します:

GSC データによれば)あるウェブサイトが別のウェブサイトよりも多くのトラフィックを獲得している場合、Ahrefs のデータを見ても同じことが言えるはずです(推定値の正確さとは無関係に)。

すでにご想像の通り、これは 2 つの数値セット間の相関関係を計算することで調査できます。

1,635 このウェブサイトのサンプルサイズにおいて、米国内の月間 GSC トラフィックと Ahrefs のデータとの相関関係は 0.76(ピアソン相関)でした。これは、上記の記述が大多数のケースで当てはまることを意味します。

Side­note.
補足:相関関係に馴染みがない方のために説明すると、「1」は 2 つの数値セットが完全に同期していることを意味します。0.76 は 1 にかなり近い数値です。 
Ahrefs のトラフィック推定値は GSC のトラフィックと強い相関がある

ちなみに、同じウェブサイト群における SEM­Rush の相関値は 0.74 でした。 

前述の通り、Ahrefs はウェブサイトのトラフィックを推定する際にかなりの誤差が生じることがあります。しかし同時に、トラフィック推定には高い整合性があります。比較するウェブサイトが同じ業界に属している場合は、なおさらです。

つまり、次の単純な計算式を使用することで、競合他社の実際の検索トラフィックをより正確に推定できるということです:

トラフィック推定の差異を補正するための計算式

自社サイトにおける GSC トラフィックと Ahrefs トラフィックの関係性は、競合他社(あなたと同じニッチに属している場合)にもほぼ同様に当てはまるはずです。そのため、多くの場合、この式を使用すればかなり正確な結果が得られます。

まとめ

この調査が、Ahrefs の検索トラフィック推定に期待できることと、乖離を考慮してより正確なデータを得る方法を理解する一助となれば幸いです。

そして何より、この調査結果は、弊社の製品チームが推定の精度をさらに向上させるための基準となります。技術的に完璧にすることは不可能であっても、改善の余地はまだかなり残されており、私たちはそれに取り組むことができます。

いつものように、コメントや質問があれば、X(旧 Twitter)で私を見つけてください。

P.S. これを手伝ってくれたデータサイエンスチームのアレックスに感謝します。