SEO 全般

llms.txt とは?重視するべき価値はある?

ライアン ・ロー
Ahrefs のコンテンツマーケティングディレクター。 過去 13 年間でライター、コンテンツストラテジスト、チームリーダー、マーケティングディレクター、部長、CMO(最高マーケティング責任者)、代理店設立といった様々な役職を経験。その間、Google、Zapier、GoDaddy、Clearbit、Algolia など数十社のコンテンツマーケティングと SEO サポートを担当。小説家の顔も持ち、これまでに 2 種類のコンテンツマーケティング専門講座を自ら開発・設計した。
Article Performance
Data from Ahrefs
  • Linking websites

The number of websites linking to this post.

This post's estimated monthly organic search traffic.


皆さんは llms.txt ファイルをご存じでしょうか?開発やマーケティングの現場では、大規模言語モデル(LLM)が自社コンテンツを「理解」できるよう、サイトに llms.txt ファイルの追加を求められることがあります。

しかし、llms.txt とは何で、誰が使うもの?そもそも何の役割があるのでしょうか。

llms.txt とは、LLM がウェブサイトの構造化されたコンテンツにアクセスし、解釈しやすくするための標準仕様として提案されているテキストファイルです。詳しい提案内容は llmstxt.org をご覧ください。

簡単に言うと、llms.txt は LLM に有益な情報(API ドキュメント、返品ポリシー、商品の分類、その他の文脈に富んだリソース)がどこにあるのかを伝えるために設計されたファイルです。これにより、言語モデルが価値の高いコンテンツを確実に見つけられるようになり、曖昧さを排除することができます。LLM はこうして、対象となる情報の重要性を推測する手間を省けるようになるのです。

llmstxt.org に掲載されている llms.txt 標準化提案のスクリーンショット。ファイルのフォーマットとセクション構成が示されている
https://llmstxt.org/ が提唱する標準化についてのスクリーンショット

理論的には、これは良いアイデアのように思えます。すでに robots.txt や sitemap.xml のようなファイルを使って、検索エンジンにサイトの内容や構造を伝えているのですから、同じ仕組みを LLM にも応用できるのでは?

しかし重要なのは、現時点では Ope­nAI や Anthropic、Google などの主要な LLM プロバイダーは llms.txt をサポートしていないということです。

Google は 2025 年 4 月に発表した Agent2Agent(A2A)プロトコルに llms.txt を組み込みましたが、これは提案中のプロトコルの中に別の提案中のプロトコルを入れ子にしたに過ぎません。Google が実際にクロールすると約束したわけではないのです。

冒頭でも述べたように、llms.txt はあくまで「提案中の標準仕様」です。

やろうと思えば筆者が標準(たとえば、please-send-me-traffic-robot-overlords.txt などを作成)を提案することもできますが、主要 LLM プロバイダーが使用に同意しない限り、ほとんど意味がありません。

これが、llms.txt の現状です。公式には採用されていない、仮説的なアイデアなのです。

お見逃しなく

robots.txt を侮るなかれ

llms.txt は、オンラインでの可視性に影響を与えないかもしれませんが、robots.txt は確実に影響を与えます。

Ahrefs のサイト監査を使えば、robots.txt の設定ミスを含む数百にも及ぶテクニカル SEO の問題を自動で監視できます。robots.txt にエラーがあると、可視性に深刻な影響が生じます。最悪の場合はサイトがクロールされなくなるかもしれません。

Ahrefs サイト監査の概要ページ。ヘルススコアとエラー、警告、通知の件数が表示されている
Ahrefs サイト監査の概要ページ
Ahrefs サイト監査で検出された robots.txt 関連のエラー一覧
Ahrefs サイト監査で検出された robots.txt のエラー

では、llms.txt ファイルの実例を見てみましょう。Anthrop­ic 社が作成した、実際の llms.txt ファイルのスクリーンショットをご覧ください。

Anthropic 社が公開している llms.txt ファイルのスクリーンショット。API ドキュメントへのリンクが H2 見出しで整理されている
Anthrop­ic 社が作成した llms.txt ファイル

llms.txt は、本質的には Mark­down ドキュメント(特別な形式のテキストファイル)で、重要なリソースへのリンクは H2 見出し(##)でカテゴライズされ、見やすくなっています。サンプル構成は以下の通りです。

# llms.txt
## Docs
- /api.md
API メソッド、認証、レート制限、リクエスト例の概要。
- /quickstart.md
開発者がプラットフォームをすぐに使い始めるのに役立つセットアップガイド。
## Policies
- /terms.md
サービスの利用方法を概説した法的条件。
- /returns.md
返品条件に該当するかの判断基準と処理に関する情報。
## Products
- /catalog.md
製品カテゴリー、SKU、メタデータなどの構造指数。
- /sizing-guide.md
カテゴリー全体にわたるプロダクトサイジングに関するリファレンスガイド。

上記を踏まえれば、簡単に独自の llms.txt を作成できます。その手順を見ていきましょう。

  1. 基本的な Mark­down ファイルを作成する
  2. H2 を使ってリソースをタイプ別にグループ化する
  3. Mark­down 対応の構造化されたコンテンツにリンクする
  4. 常に最新の状態に保つ
  5. ルートドメイン(https://yourdomain.com/llms.txt)でホストする

こういった llms.txt は自分で作成することも、こちらの無料 llms.txt ジェネレーターを使って生成することもできます。

無料の llms.txt ジェネレーターの画面。URL を入力すると自動で llms.txt ファイルを生成できる
無料の llms.txt ジェネレーター

一部の開発者は、llms.txt ファイルにトークンの使用上限や優先するファイル形式などの LLM 向けの独自メタデータを実験的に追加しているようですが、クローラーや LLM モデルがこれを実際に参照しているかどうかは定かではありません。

llms.txt を使用している企業のリストは、コミュニティが運営している公開済み llms.txt ファイルのインデックス directory.llmstxt.cloud から閲覧できます。

以下が使用している企業の一部です。

  • Mintli­fy:開発者向けドキュメントプラットフォーム
  • Tiny­bird:リアルタイムデータ API
  • Cloud­flare:パフォーマンスとセキュリティに関するドキュメントリスト
  • Anthrop­icAPI ドキュメントの完全な Mark­down マップ公開

では、大手企業はどうでしょうか?

今のところ、主要な LLM プロバイダーの中で、llms.txt をクローラープロトコルの一部として正式に採用している企業はありません。現状は次の通りです。

  • OpenAI(GPTBot):robots.txt への評価は高いものの、公式には llms.txt を使用していない
  • Anthropic(Claude):独自の llms.txt を公開しているが、自社のクローラーが標準規格を使用しているとは明言していない
  • Google(Gemini/Bard)AI のクロール動作を管理するために robots.txt(Google-Extended ユーザーエージェント経由)を使用しているが、llms.txt のサポートについては言及していない
  • Meta(LLaMA):公開されたクローラーやガイダンスはなく、llms.txt の使用についても言及されていない

これは重要なポイントを浮き彫りにしています。llms.txt を作成することと、それをクローラーの動作に反映させることは同じではないということです。つまり現時点では、ほとんどの LLM ベンダーは llms.txt をおもしろいアイデアであると認識しているものの、優先して採用し対応すべきものとは考えていないのです。

現時点では実際に llms.txt が役に立つとは言えない、というのが筆者の見解です。

llms.txt が AI 検索を向上させたり、トラフィックを増加させたり、モデルの精度を高めたりするという確証はなく、llms.txt のパースを約束しているプロバイダーもありません。

とはいえ、設定が非常に簡単なことは否めません。製品ページや開発者向けドキュメントなどの構造化されたコンテンツが既にある場合は、それをもとに Mark­down ファイルとして作成し、自社ウェブサイトでホストするだけです。設定しても目に見えるメリットはないかもしれませんが、リスクもありません。ただ、LLM が最終的にこれを標準として採用すれば、早期導入することで多少のメリットが得られるかもしれません。

現時点で llms.txt が注目を集めているのは、誰もが LLM の可視性を高めたいと願っているものの、それを実現する手段がないため、コントロールできそうな気がするアイデアに飛びついているだけだと思います。

お見逃しなく

AI の可視性を追跡する方法

AI システムにおける可視性を実際に追跡したいなら、テキストファイルに期待するよりも、Ahrefs の 2 つの機能で実データを取得しましょう。

  • ボットアナリティクス(ベータ版、無料):AI ボットが実際にサイトを訪問しているかを確認できます。AI アシスタント、AI 検索ボット、AI クローラーなど 12 カテゴリのボット訪問を、Cloudflare 経由のサーバーサイドデータ収集で追跡します(JavaScript 不要)。GPTBot や Claude­Bot が llms.txt を見に来ているかどうかも確認可能です。
  • ブランドレーダーAI アシスタントが実際にブランドについてどう語っているかをモニタリングできます。ChatGPT、Perplexity、Gemini などのプラットフォーム全体で言及を追跡し、ユーザーが問い合わせた際にこれらのモデルが何を回答しているかを確認できます。

さらに、llms.txt は、あるかないかわからない問題に対処するために無理やり作り出された解決策であると筆者は考えています。検索エンジンは既に robots.txt や sitemap.xml といった既存の標準を使用してコンテンツをクロールし、理解しています。LLM もほぼ同じインフラを使用して事足りているのです。

Google 社のジョン・ミューラーさんは、最近の Red­dit 投稿で次のように述べています。

「私の知る限り、どの AI サービスも LLMs.TXT を使用しているとは言っていないし、サーバーログを見ればチェックすらしていないことがわかります。私にとっては、LLMs.TXT はキーワードメタタグと同じように、サイトオーナーが『自分のサイトはこうだ』と主張しているだけのものに過ぎない…(実際にそのサイトがそうなのかは、直接チェックすれば分かることでは?)」

ジョン・ミューラー、Search Advo­cate、Google

これについてご自身の意見をお持ちの方、あるいは反対の事例をご存知の方は、ぜひ X までメッセージをお寄せください。

https://ahrefs.canny.io/

Ahrefs をもっと活用 👉
▶︎ Ahrefs 公式ブログ — 本社発信の記事
▶︎ Ahrefs Can­ny — 開発チームへ意見を送る
▶︎ X 公式アカウント— 最新情報をリアルタイムで
▶︎ YouTube 公式チャンネル— 動画コンテンツをチェック
▶︎ Ahrefs note — 日本チーム発信の記事

Article Performance
Data from Ahrefs
  • Linking websites

The number of websites linking to this post.

This post's estimated monthly organic search traffic.