データ・研究

AI が引用する URL のうち、元のプロンプトで Google トップ 10 に表示されるのは、わずか 12%

ルイーズ・ リネハン
Ahrefs のコンテンツマーケター。Pi Datametrics、BuzzSumo、Cision といった SaaS 企業でシニアコンテンツ担当として 10 年以上の経験を積む。日中はコンテンツや SEO について書き、オフや仕事の後はサッカーやカラオケを趣味として楽しむ。
15,000 件のプロンプトを含むデータを分析した結果、ChatGPT、Gemini、Copilot が引用したリンクのうち、同じプロンプトで Google 検索をした際にトップ 10 に表示されるものは、平均でわずか 12% にとどまることが分かりました。

Per­plex­i­ty だけが例外で、引用リンクのおよそ 3 件に 1 件が、同じ検索クエリに対する Google のトップ 10 にランクインしています。 

Ahrefs は ChatGPT、Gemini、Copilot、そして Per­plex­i­ty の 4 つの AI アシスタントを分析し、これらが引用、参照する URL が、 Google や Bing で同じクエリを検索した際にどの程度重複するかを調べました。 

平均して、AI アシスタントと Google および Bing のトップ 10 との引用の重複率は 11% でした。 

((Google AI 重複合計 + Bing AI 重複合計)) / 10) = 10.96%

Ahrefs ブランドレーダーを用いた調査:AI による引用のうち、Google と Bing のトップ 10 に重複しているのはわずか 11%

以下では、これを検索エンジンごとに見ていきます。

Ahrefs のデータサイエンティストであるシベイジャ・グアンは、Ahrefs ブランドレーダーのデータを使用し、Google と Bing で 15,000 件のロングテールクエリを検索し、その後同じ質問を AI アシスタントに投げかけました。

クエリの例: 

  • 「防犯カメラの設置費用はいくらですか?」
  • 「乳製品が食べられない場合、どうすれば十分なタンパク質を摂取できますか?」
  • 「最も安いフルカバー型の自動車保険はどれですか?」
  • 「¿Cuál es el mejor suple­men­to para la recu­peración muscular?」(筋肉回復に最適なサプリメントはどれですか?)
Ahrefs ブランドレーダーで「How much does it cost to install a security camera」というクエリを検索した画面

次に、検索と AI の両方のインデックスから、各質問に対して返された確認できる引用をすべて抽出しました。

検索データセットでは、引用された URL の検索順位を記録し、それらがトップ 10 またはトップ 100 の結果に表示されるかどうかで分類しました。 

テスト対象となった AI アシスタントには、ChatGPT(本文内の引用と、参考文献の引用の両方)、Gemini、Copilot、Perplexity が含まれます。 

Ahrefs のデータサイエンティストであるシベイジャ・グアンが実施した調査によると、AI アシスタントの引用のうち、Google のトップ 10 にもランクインしているのは、平均してわずか 12% でした。

((28.6 + 8 + 6.1 + 8.6 + 8.2) / 5) = 11.9%

Ahrefs ブランドレーダーを用いた調査:AI による引用のうち、Google のトップ 10 に含まれるのは 12%

一方、これらの引用の 80% は、元のクエリに対して Google で全くランクインしていません。この 80% は、上のグラフにある「赤い」列の平均値にあたります。

AI と検索の引用の重複は予想よりも小さいものでしたが、その理由についてはいくつかの仮説があります。詳しくは、後ほど取り上げます。

Perplexity が Google と最も一致

Per­plex­i­ty は、文字通り引用するために作られた AI アシスタントです。その目的は、ほぼすべての記述を出典で裏付けることにあります。

Per­plex­i­ty は世界初のアンサーエンジンです。インターネットをリアルタイムで検索し、あらゆる質問に対して迅速で明確な答えを、出典や引用付きで提供します。すべての回答にはクリック可能な引用が付いており、情報を簡単に検証したり、さらに深く掘り下げたりすることができます。

Per­plex­i­ty チーム, 2024 年 10 月

一方、ChatGPT と Gem­i­ni は、必ずしも外部リンクを提示するわけではありません。

これらの引用プロセスはクエリに大きく依存し、内部システムが異なる基準に基づいて検索を実行する仕組みになっています。

例えば Chat­G­PT は、「ソニック・クラシファイア」と呼ばれるものを使用しているようです。プロンプトの「確率」が特定のしきい値を超えた場合(つまり、回答が学習データに基づいて「予測」しにくい場合)、ChatGPT はウェブ検索を実行します。

これに対して、Perplexity は Google で上位にランクインするコンテンツを一貫して好んでおり、引用された URL の 28.6% がトップ 10 に入っています。 

他の AI アシスタントでは、その数値は約 8% に留まり、引用の 80% 以上がターゲットクエリで全くランクインしていないページから来ています。 

Per­plex­i­ty は引用に強く重点を置いているため、その結果が Google の結果と密接に一致するのは理にかなっているように思われます。 

しかし、Gemini や他の AI アシスタントとは異なり、Perplexity は Google や Bing のインデックスを利用していません。実際、同社は独自のクローラーである per­plex­i­ty­bot に基づいた、独自の検索インデックスを持っています。

AI アシスタントは Google や Bing を使っていても、検索インデックスの利用方法そのものが根本的に違うようです。だからこそ、重複がほとんど見られないのでしょう。

Bing の結果と比較した場合でも、トップ 10 での重複率は低いままで、平均でおよそ 10% にとどまります。 

((16.6 + 14 + 8.1 + 8.1 + 3.3) / 5) = 10.02%

Ahrefs ブランドレーダーを用いた調査:AI による引用のうち、Bing のトップ 10 に重複しているのは 10%

Copi­lot がリストのトップに躍り出ていますが、これは Microsoft 傘下の製品であり、回答を生成する際に Bing の検索結果を利用していることを考えれば当然の結果です。

Per­plex­i­ty は依然として SEO と最も親和性の高い AI アシスタントのひとつであり、ChatGPT と Gem­i­ni は最も重複が少ない結果となりました。 

今回の調査は、Google の AI Overview において上位表示ページがどのくらいの程度引用されるかを調べた以前の調査に基づいています。 

関連記事: 

以前の調査では、Google のランキングと AI Overview の引用との間に中程度の正の相関が見られ、引用 URL の 76% がトップ 10 ページからのものでした。 

Ahrefs の AI Overview 調査:引用された情報の 76% が検索上位 10 ページから取得されている

データに基づくと、AI Overview は従来の検索の延長線上にある機能のように動作し、主に SERP を反映した結果を表示しているようです。 

言い換えれば、AI Overview は SERP に従いますが、AI アシスタントはそうではない、ということです。

Google が開発したアシスタントでさえ、Google の SERP と密接に一致しているわけではありません。 

実際に何が引用されるかは、検索順位だけでは決まらず、ほかにもいろいろな要素が関わっているようです。

Ahrefs のデータによれば、AI アシスタントが引用する URL は、Google や Bing のランクと一致するケースはごくわずかでした。 

対象プロンプトでトップ 10 に表示されることはほとんどなく、なかにはトップ 100 にすら入らないケースもあります。 

これは、AI アシスタントが検索エンジンと同じ方法で結果をランク付けしていないためです。 

何を引用するかを決定する際に、単一のユーザークエリを処理するのではなく、そのクエリの複数のバリエーションに基づいてページを取得する傾向があります。これは「クエリ・ファンアウト」として知られるテクニックです。

こうしたバリエーションは、その後、相互ランク融合(RRFのような方法で統合され、何度も現れるページが優先される仕組みになっています。

例えば、「コーヒーマシンの水垢を除去する方法」「ネスプレッソマシンの掃除」「コーヒーメーカーから石灰分を取り除く」でいずれも 6 位前後に入っているページは、1 つの検索でしか 1 位を取っていないページよりも引用されやすくなります。 

実際のところ、AI アシスタントはユーザーが入力したプロンプトそのものを検索することは、そもそもないのかもしれません。 代わりに、それをきっかけとして派生的な複数のクエリを展開している可能性があります。

そのため、最終的に提示される引用が元のプロンプトで必ずしも上位に表示されるとは限りません。

また、パーソナライズも影響する可能性があります。まったく同じ検索クエリであっても、ユーザーのプロンプトや会話履歴といった要因によって、AI が提示する引用は大きく異なる場合があります。 

こうしたことすべてが、AI の引用が必ずしも SERP と一致しない理由を説明しているのかもしれません。 

Tip
Ahrefs キーワードエクスプローラーでは、親トピック機能を使って複数のロングテールクエリのバリエーションに最適化することができます。キーワードを検索したら、「フレーズ一致」または「関連用語」レポートに移動し、左側にあるキーワードタブの「親トピック別」をチェックするか、「親トピック別のクラスター」タブをクリックしてください。さらに、「フレーズ一致」の「質問」タブを開けば、コンテンツで狙うべきロングテールクエリを簡単に見つけられます。

そして、既存のロングテールクエリのバリエーションに対して、どれくらい自社サイトが表示されているかを確認するには、「ターゲット」フィルターに自社のドメインを追加します。
Ahrefs の 「親トピック別のクラスター」タブでターゲットを追加し、関連キーワードでの順位を確認している画面。「フレーズ一致」レポートが表示されており、キーワードクラスタの規模に応じてサイズと色が異なるボックスで表現されている


アレクシス・リルコ氏による最近のテストでは、SearchGPT の引用が Google の引用と非常によく似ていることが示されています。

リルコ氏は、ChatGPT が現在、密かに Google の検索インデックスから情報を取得している可能性があると考えています。 

アレイダ・ソリス氏もこれを確認しており、Bing のページにアクセスできないときに Chat­G­PT が Google を代わりに利用していることを突き止めました。

これらの発見は多くの人にとって意外なものでした。というのも、ChatGPT の組み込みプロバイダーは Bing だからです。 

Ahrefs のデータセットから見る限り、ChatGPT が Google と Bing の結果をどのように表示するかについて、大きな差はあまり見られません。

Google
(トップ 10)
Bing
(トップ 10)
Google
(トップ 100)
Bing
(トップ 100)
Chat­G­PT
(本文内の引用)
8.00%8.10%8.80%5.00%
Chat­G­PT
(参考文献の引用)
6.10%8.10%9.20%5.20%

とはいえ、このデータは 7 月初旬に収集されたものなので、その後結果が変化している可能性もあります。特に、OpenAI が AI ファーストのウェブブラウザを発表する予定や、最近のメモ流出で示唆された独自の検索インデックス構築を考えると、その可能性は十分に高いと言えるでしょう。

Ahrefs は、今後も引用の変化を追うために、調査を続けていくつもりです。

まとめ

Ahrefs の調査では、上位にランクインすることは確かに役立つようですが、必ずしも想定していたようなクエリで効果を発揮するとは限らないことが分かりました。

従来型検索と AI での引用の一致度が今後どう推移するのか、Ahrefs は継続的に検証していきます。 

その一方で、AI に引用されるためには、クエリの多様化への対応、トピッククラスターの整備、そして「エンティティの確立」が大事なポイントになりそうです。