データ・研究

新規ウェブページの 74% に AI 生成コンテンツ。90 万件を大調査で明らかに

ライアン ・ロー
Ahrefs のコンテンツマーケティングディレクター。 過去 13 年間でライター、コンテンツストラテジスト、チームリーダー、マーケティングディレクター、部長、CMO(最高マーケティング責任者)、代理店設立といった様々な役職を経験。その間、Google、Zapier、GoDaddy、Clearbit、Algolia など数十社のコンテンツマーケティングと SEO サポートを担当。小説家の顔も持ち、これまでに 2 種類のコンテンツマーケティング専門講座を自ら開発・設計した。
2025 年 4 月に新たに公開された 90 万件のウェブページを分析したところ、その 74.2% に AI 生成コンテンツが含まれていることが判明しました。

Ahrefs の機械学習チームは、「AI コンテンツディテクター」(コードネーム:bot_or_not)を開発し、Ahrefs のユーザー向けに近日リリース予定です。そこで今回は、かねてから気になっていた次の問いに答えるべく、このツールの性能を検証してみることにしました。

「新規コンテンツのうち、AI によって生成されたものの割合はどのくらいか?」 

Side­note.
本調査はデータ サイエンティストのシーベイジャ・グアンCMOティム・ソウロにより実施されました。この場を借りて 2 人に感謝を伝えたいと思います。
サイトエクスプローラーのページ検査ツールの一部として近日リリースされる Ahrefs の AI コンテンツディテクター
AI コンテンツディテクターは、サイトエクスプローラーのページ検査ツールの一部として近々リリースされる予定です。

調査では、bot_or_not を用いて、2025 年 4 月に Ahrefs のウェブクローラーによって新たに検出された英語のウェブページ 90 万件を対象に分析を行いました。 

1 ドメインにつき 1 ページを対象としたので、90 万の異なるドメインのコンテンツを検証したことになります。各ページは、コンテンツのうちどの程度が AI によって生成されているかという AI コンテンツディテクターの判定に基づいて分類されました。 

AI コンテンツディテクターによる判定結果は次の通りです。 

  • 2.5% が「完全に AI 生成」 
  • 25.8% が「完全に人によって作成」
  • 71.7% が「人と AI が混在」 

そのうち、人と AI が混在するページでの AI 生成の割合は、以下のとおりでした。

  • 25.86% で中程度 AI を使用(コンテンツの 11% ~ 40% が AI 生成)
  • 20.50% で大部分で AI を使用(41% ~ 70% が AI 生成)
  • 15.51% でほぼ AI によるもの(71% ~ 99% が AI 生成)
2025 年 4 月に公開された 90 万超のウェブページのうち、約 72 %が AI による支援または生成コンテンツを含んでいることを示す円グラフ。

調査したページの約 4 分の 3 に AI 生成コンテンツが含まれていたことには驚きました。しかし、データを眺めるうちに、その理由が徐々に理解できるようになりました。

Google ドキュメント、Gmail、LinkedIn では、無料の高速な AI コンテンツ生成機能が標準搭されています。 Slack メッセージの要約や、記事の調査、文字起こしの要約など、AI ができることは多くあり、今ではあの目立つ「生成」ボタンを避ける方が難しい状況になりつつあります。

今後、生成 AI がさまざまなアプリにさらに深く組み込まれるにつれて、ますますその傾向は強まるでしょう。

 Google ドキュメントで標準機能として利用できる生成 AI の例
Google ドキュメントで標準機能として利用できる生成 AI の例。

また、AI 生成コンテンツが増えれば、それを参照する新しいコンテンツにも AI 生成コンテンツが含まれるようになります。そうなれば、AI コンテンツはさらに急速に広がり、関連するものすべてに大なり小なりの影響を与えるようになるでしょう。

さらにこれを裏付けるように、筆者が 879 人のコンテンツマーケターを対象に実施したアンケートでは、87% がコンテンツの作成または作成の補助に AI を使用していると回答しました。一方、AI を全く使用していないと回答したのはわずか 13% でした。 

「コンテンツ作成に AI を使っていますか?」という質問に対し、87.37% のマーケターがが「はい」、12.63%が「いいえ」と回答したことを示す棒グラフ。

そして、予想通り、AI 生成コンテンツとして最も一般的なものは、ブログ記事でした。

AI によって作成されるコンテンツの中で最も多いのはブログ記事(87.1%)であり、次いでランディングページなどのウェブサイトコピー(63.7%)、SNS投稿(62.7%)が続くことを示す横棒グラフ。

LLM はあまりにも便利で安価であるという理由で、利用しない手はありません。そのため、コンテンツ作成における生成 AI の活用は、急速に標準になりつつあるのです。

まず、完璧な AI コンテンツディテクターは存在しません。ツールによって検出手法はさまざまで、どのツールにも長所と短所がありますが、すべての AI コンテンツディテクターに共通する問題点があります。それは、限られたデータセットで学習されることが多いこと、部分的に AI が使用されているコンテンツの検出が難しいこと、「人間らしく」するツールに対して脆弱であることです。

Ahrefs チームはこういった限界を理解した上で、前述の問題を考慮してツールを開発しました。自社コンテンツで AI コンテンツディテクターをテストした結果、結果は良好でしたが、他の主要なコンテンツ検出ツール同様、100% の精度を達成することはできません。 

ただ、SEO 指標も 100% 正確なものは存在しません。皆、戦略を策定するのに検索ボリュームのデータを利用しますが、以前にも記事で書いたように、「正確な」検索ボリュームというものは存在しないのです。それと同じように、AI コンテンツ検出も完璧ではなくても、非常に有用であるといえます。

競合他社がどれだけの AI コンテンツを公開しているか、どのモデルを使用しているか、それが時間とともにどのように変化しているかを確認できます。

また、特定の SERP にどれだけの AI コンテンツが存在するかを推定し、ランキング向上のためにさらに労力を投入する必要があるかどうかを判断できます。

さらに、検索トラフィック、キーワードランキング、被リンクなどのオーガニック検索のパフォーマンス指標が、AI の利用レベルとどのように相関しているかを知ることもできます(この記事を書いている現在、これについての調査を実施しているところです)。

もちろん、こういったツールだけに頼って、コンテンツ作成者に関する決定的な判断を下すべきではありませんが、AI コンテンツがあふれるこの時代、データ活用に秀でたマーケティング担当者にとっては、優れたデータソースであることは間違いありません。

Ahrefs の新 AI コンテンツ検索ツールをお試しください

新しい AI ツールは、サイトエクスプローラーに組み込まれる形でまもなくリリース予定です。無料の AI コンテンツディテクターをさらに改良したものですので、ぜひ試してみてくださいね。