データ・研究

AI Overview の引用=AI コンテンツ >人作成コンテンツを徹底分析

スー・ チュアン ・オン
Ahrefs|シニアコンテンツマーケター。 これまで 6 年間、デジタルマーケティングに携わり、アジアで開催される業界最大のカンファレンス(TIECon および Digital Marketing Skill Share)で数回講演を行っている。気になることを Substack(サブスタック)にも投稿中。
AI Overview もまた AI によって生成されたコンテンツであるため、ハルシネーション(AIが生成する、もっともらしい偽情報)を含む可能性があります。

Google はその正確性を高めるために「グラウンディング」(事実情報に基づかせる技術)を用いていますが、Ahrefs の調査によると、AI Overview は人が書いたコンテンツよりも、AI が生成したコンテンツを引用する可能性が高いことが分かりました。

では、Ahrefs の調査で明らかになったことを見ていきましょう。 

キーワードエクスプローラーから AI Overview が表示されている 100 万件の SERP (検索結果ページ) を抽出し、引用されている上位 3 つのリンクを特定しました。合計 190 万件の URL のうち、Ahrefs のデータベースには 50 万件の URL がみつかりました。 

次に、各 URLサイトエクスプローラーページ検査機能の一部である、Ahrefs 独自の AI コンテンツ検出ツールにかけました。 

自分のブログ記事を AI コンテンツ検出ツールにかけている様子

以下が、Ahrefs のコンテンツ検出ツールによる分析結果です。 

AI Overview で引用されたページの分類は、 

  • 3.6% が「100% AI によるもの」
  • 8.6% が「100% 人間によるもの」
  • 87.8% が「人と AI のミックス」でした。

また、「人と AI のミックス」と分類されたページの内訳は以下の通りです。

  • 11.2% が最小限の AI 使用 (ページコンテンツの 1~10% が AI
  • 44% が中程度の AI 使用 (同 11~40%)
  • 24.7% が相当量の AI 使用 (同 41%~70%)
  • 7.9% が大部分で AI 使用 (同 71%~99%)
検出ツールの結果において、AI Overview 内のページのうち、AI によって作成/支援された割合

この結果は、以前 Ahrefs が実施したウェブ全体の AI コンテンツに関する調査と比較すると、さらに際立ちます。90 万件の新規ページを分析したその調査では、以下のような分類結果が得られていました。

  • 2.5% のページが「100% AI によるもの」 
  • 25.8% が「100% 人間によるもの」 
  • 71.7% が「人と AI のミックス」 

今回の調査は新規ページのみを対象としており限定的ではありますが(また、AI Overview で引用される URL のすべてが新しいページではありませんが)、それでもこの結果は、通常ウェブ上のコンテンツにおいて AI コンテンツはそう多くないのにもかかわらず、Google の AI Overview が、AI により生成または支援されたコンテンツを引用する傾向にある、つまり AI Overview の引用には偏りがあることを示唆していると言えるかもしれません。 

Side­note.
完璧な AI コンテンツ検出ツールというものは存在しません。LLM と同様、AI 検出ツールも統計モデルです。100% 確実なものではなく、可能性の高いものに着目しています。非常に高い精度を発揮することもありますが、常に誤検知(フォールス・ポジティブ)のリスクがあることは否めません。

AI 検出ツールの仕組みやその有用性については、以下の記事で詳しく解説していますので、ぜひ参照してください。

Ahrefs は、データセット全体を対象に、AI コンテンツの割合と AI Overview 内での引用順序との相関関係を計算しました。その相関係数は 0.017 で、実質的にゼロでした。

この結果は、Google が AI Overview の引用元を選ぶ際に、そのコンテンツが人間によって書かれたものか AI によって生成されたものかに基づいて、明確に冷遇したり優遇したりすることはないことを示唆しています。

しかし、引用されたページの 87.8% が少なくとも AI の支援を受けたものであることを考えると、私たちは、Google 自身の AI 生成コンテンツが、他の AI 生成コンテンツを引用し、それによってフィードバックループを生み出す自己循環的な情報生成の構造をリアルタイムで見ていると言えるかもしれません。

とはいえ筆者は、Google がこの点について必ずしも怠慢であるとは思いません。私たちが目にしている現象の一部は、単に現在のウェブ状況をリアルに反映しているだけかもしれないからです。例えば、Ahrefs が 90 万ページを対象に行った調査では、新規ウェブページの 74% が AI 生成コンテンツを含んでいることが分かっています。

2025年4月の新規公開ページにおいて、AI によって作成/支援された割合

Google はコンテンツをクリエイターに依存しています。しかし、当のクリエイターは、コンテンツ作成やその補助に AI をますます活用する傾向があります。一例を上げれば、Ahrefs が 879 人のマーケターを対象に実施した『コンテンツマーケティングにおける AI の現状』レポートでは、回答者の 87% がコンテンツ作成に AI の支援を得ていると回答しています。 

コンテンツ作成に AI を使っているマーケター数に基づく割合を示す棒グラフ

そして、Google が RAG (検索拡張生成) を通じて精度を向上させようと試みているにもかかわらず、Ahrefs の調査では、上位表示ページの 86.5% が何らかの形で AI によって生成されたコンテンツを含んでいることもわかっています。

上位 20 件の検索結果における、AI によって作成/支援されたページの割合

これは、AI Overview が、AI によって生成されたコンテンツが増えているエコシステムから情報を引き出していることを意味します。私たちは今、AI 同士が情報のやり取りをする AI コンテンツのエコシステムが生まれるのを目撃していると言えるのかもしれません。 

AI コンテンツ検出ツールを使ってみる

Ahrefs の AI 検出器は、サイトエクスプローラーの機能の一部です。任意の URL を入力し、ページ検査に移動して、AI 検出器のタブをクリックするだけで簡単に利用できます。

AI コンテンツ検出ツールに至る画面

そうすると、コンテンツの何パーセントが AI によって生成されているか、そしてそこにはどの LLM (大規模言語モデル) が使用されたかが、次のように表示されます。ぜひ、分析に役立ててください。

AI コンテンツ検出ツールによる AI 含有率の表示グラフ