llms.txtファイルとは?2026年版・完全ガイド
llms.txtは、大規模言語モデルに対してサイトの重要なコンテンツを案内するために、ドメインのルート(https://yoursite.com/llms.txt)に設置するMarkdownファイルです。2024年9月にJeremy Howard(fast.aiおよびAnswer.AIの共同創設者)によって提案され、llmstxt.orgにて仕様が公開されています。AIエージェントのために書かれたREADMEとお考えください。簡潔で人の手によってキュレーションされており、最も重要なページを的確に示します。
この記事では、よく寄せられる疑問にお答えします。llms.txtとは何か、robots.txtやsitemap.xmlとどう違うのか、AIエンジンが実際に読み取るのかどうか、何を記載すべきか、そして30分で実装する方法です。また、オプションの companion ファイルであるllms-full.txtについての説明と、そのままコピーして使える実例もご紹介します。
一段落でわかるまとめ
llms.txtは、ドメインの/llms.txtに設置する単一のMarkdownファイルで、重要なページを一行の説明付きで一覧にしたものです。サイト全体をクロールしなくても、AIエージェントやLLMがサイトの内容を素早く把握できるよう設計されています。フォーマットはシンプルで、サイト名を記した最上位の#見出し、任意の>ブロッククォートによるサマリー、そしてMarkdown形式のリンクと説明を含む##セクションで構成されます。採用は任意であり、強制する仕組みはありません。ただし、実装コストは低く、デメリットも皆無なため、AI検索での認知向上を意識するチームの多くが今では導入しています。
llms.txtが生まれた理由
話の出発点は、AIエージェントがウェブサイトにアクセスしたときに直面する問題です。あなたのサイトには、おそらく数十〜数百のページがあり、それぞれJavaScriptでレンダリングされ、ナビゲーション、マーケティング用ウィジェット、クッキーバナー、フッターリンクに囲まれています。あなたのプロダクトに関する質問に答えようとするエージェントには、次の三つの不満足な選択肢しかありません:
- すべてのページをクロールする。 時間とコストがかかるうえ、ほとんどのページはエージェントの質問に関係ありません。クッキーバナーの文言に費やしたトークンは、実際の回答に使えなくなります。
- sitemap.xmlを読む。 URLの一覧は手に入りますが、どのページが重要かを示すシグナルも、説明文も、人の手によるナレーティブもありません。1,200件のURLを持つsitemapは検索エンジンには役立ちますが、何をフェッチする価値があるかをエージェントが判断する助けにはなりません。
- ブラウザでホームページをレンダリングする。 マーケティング文言は取得できますが、ドキュメント、料金の詳細、ポリシーページは見落とします。しかも、エージェント規模ではフルページのJSレンダリングは相当なコストになります。
llms.txtはこのジレンマを断ち切ります。どのページが重要かを一番よく知っているサイトオーナーが、エージェントを関連コンテンツへと直接案内する短いMarkdownインデックスを書くのです。エージェントはファイルひとつ(数KB)を取得し、キュレーションされたマップを入手し、明確なヒントをもとに次に読むべきものを判断します。帯域・レイテンシ・トークンコストのすべてが削減されます。
llms.txt vs robots.txt vs sitemap.xml
この三つのファイルはよく混同されます。実際には互いを補完するものであり、それぞれが異なる問いに答えています:
- robots.txt 「何にアクセスしてよいか?」に答えます。クローラーに対して、どのパスがアクセス可能でどのパスが立ち入り禁止かを伝えるパーミッションファイルです。コンテンツの説明ではなく、ボットへの指示です。
- sitemap.xml 「どんなURLが存在するか?」に答えます。インデックス可能なすべてのURLをメタデータ(最終更新日、変更頻度、優先度)付きで列挙した機械可読のリストです。検索エンジンの発見のために設計されており、長くて網羅的で、編集上の判断は含みません。
- llms.txt 「最初にどこを見ればよいか?」に答えます。人の手でキュレーションされた、読みやすいMarkdownインデックスで、最も重要なページを説明付きで示します。AIエージェントのために設計されており、短くて、主観的で、手動で編集されています。
どれかひとつを選ぶものではありません。真剣に取り組むサイトは三つすべてを備えています。それぞれ異なる利用者向けのものです。robots.txtは従来型クローラー向け、sitemap.xmlは検索エンジン向け、llms.txtはAIエージェント向けです。
フォーマットの詳細
llms.txtはプレーンなMarkdownです。llmstxt.orgの仕様によると、構造は以下の通りです:
- H1見出し にサイト名またはプロダクト名を記します。必須であり、必ずひとつだけ設置します。
- 任意のブロッククォート (>)でサイトの概要を一段落にまとめます。強く推奨されており、エージェントが最初に読む部分です。
- 任意のプレーンテキスト段落 で補足情報を加えます。簡潔にとどめてください。
- H2セクション でリンクを目的別にグループ化します。よく使われるセクション名は ## Documentation、## Product、## Trust & policies、## Optional などです。
- Markdown形式のリンク を各セクション内に記載し、必要に応じてコロンと説明文を続けます。フォーマット:- リンクテキスト: 説明文。
特別なセクション名がひとつあります。## Optional は、エージェントがコンテキストに余裕がない場合にスキップしてよいページのために予約されています。仕様によると、エージェントはOptionalセクションを優先度の低い読み物として扱うべきとされています。トランザクション的なページやコンテンツ情報量の低いページ(会員登録フォーム、お問い合わせページなど)をファイルから完全に除外せずに区別するための方法です。
実際の例
agentceres.comで公開しているllms.txtを(一部省略して)ご紹介します:
# Ceres > Ceres is your AI Growth Officer — the first AI agent that > runs marketing 24/7 for indie founders and small SaaS teams. > Specialist agents deliver evidence-cited briefings in > Slack; outbound content ships as drafts for your review. ## Product - [Landing page](https://agentceres.com/): Meet Ceres — the AI Growth Officer for indie SaaS - [How it works](https://agentceres.com/how-it-works): The evidence chain, memory system, and human-review posture - [Pricing](https://agentceres.com/pricing): Four flat-price plans from $19/mo ## Documentation - [Documentation](https://agentceres.com/docs): Operator and customer-facing setup docs ## Trust & policies - [Security](https://agentceres.com/security): Tenant-isolation, evidence requirements, approval boundary - [Privacy](https://agentceres.com/privacy): Privacy policy - [Terms](https://agentceres.com/terms): Terms of service ## Optional - [Sign up](https://agentceres.com/signup): Free trial signup — transactional page, not informational reading - [Contact](https://agentceres.com/contact): Contact form — transactional page, not informational reading
全文はagentceres.com/llms.txtでご覧いただけます。構造に注目してください。ブランド名にH1、ブロッククォートのサマリー、目的別に整理されたセクション、各リンクへの説明行、そしてトランザクション的なページを ## Optional にまとめた構成になっています。
llms.txt と llms-full.txt の違い
仕様では、オプションの companion ファイルとして llms-full.txt も定義されています。両者の役割は異なります:
- llms.txt — インデックスです。短く(一般的に500〜2000語)、キュレーションされており、重要なページへのリンクを含み、最初にフェッチされます。
- llms-full.txt — フルコーパスをフラット化したものです。インデックスに掲載されたページの実際のコンテンツを一つのMarkdownドキュメントに連結したもので、トークン効率のためにミニファイされることもあります。エージェントがクロールなしにワンリクエストでナレッジベース全体を取得できるようにします。
小規模なサイトは通常 llms.txt だけで十分です。ドキュメントが充実したサイト(ドキュメントポータル、ヘルプセンター、長大なブログアーカイブなど)の場合、llms-full.txt も用意することで、エージェントがN回のラウンドトリップなしに全コンテンツを取得できます。ホスティングプロバイダーのレスポンスサイズ制限に収まるようにしてください(CloudflareやVercelは一般的に寛大ですが、CDNによっては10〜25MBを上限としている場合があります)。
自分のllms.txtを作る方法 — 30分バージョン
最速の手順は以下の通りです:
- 空のファイルを作成する。 ファイル名は llms.txt とします。サイトの public/static ディレクトリに置いてください(Next.js の場合は public/llms.txt、Vite の場合は public/llms.txt、静的サイトジェネレーターの場合はビルド出力のルート)。
- H1とブロッククォートを書く。 # 見出しにプロダクト名またはサイト名を、> ブロッククォートに「これは何か?」を2〜3文で答える一段落を書きます。
- セクションを追加する。 まず三つから始めます:## Product、## Documentation、## Trust & policies。そして、会員登録・お問い合わせ・ログインなどトランザクション的なページには ## Optional を追加します。
- リンクを厳選する。 すべてのURLを詰め込みたい衝動を抑えてください。キュレーションこそが目的です。典型的なSaaSランディングサイトなら8〜15リンクで十分です。ドキュメントが充実したサイトなら25〜40リンクが妥当でしょう。
- 各リンクに説明文を書く。 そのページが何を扱っているかを具体的に一文で記します。マーケティング的な誇大表現は避けてください(「最高のX」はノイズです)。エージェントがそのページを読んで得られる情報を書きましょう。
- ルートで配信されていることを確認する。 デプロイ後、curl https://yoursite.com/llms.txt を実行してファイルが返ってくること、404やSPAシェルが返っていないことを確認します。よくある落とし穴:SPAのフォールバックがすべてのパスを index.html にリライトしてしまう場合があります。/llms.txt が静的ファイルとして配信されるよう設定の調整が必要なことがあります。
- sitemapに追加する(任意)。 発見性向上のために、sitemap.xml から llms.txt を参照するチームもあります。厳密には必須ではありませんが、害もありません。
よくある失敗
- sitemapのように使ってしまう。 説明文のない1,200件のリンクは目的を損ないます。llms.txtはキュレーションされたインデックスであり、URLの羅列ではありません。
- 説明文にマーケティング文句を使ってしまう。 「世界最高のAI搭載カスタマーサクセスプラットフォーム」という記述はエージェントに何の役にも立ちません。そのページが何を含んでいるかを書きましょう。どう見られたいかではなく。
- ## Optionalを忘れてしまう。 トランザクション的なページを区別しなければ、エージェントは会員登録フォームやお問い合わせページから情報を抽出しようとしてトークンを無駄にします。
- 内容が陳腐化する。 llms.txtを公開した後に更新しないと、ファイルが実際のサイトとかけ離れていきます。ドキュメントと同様に扱いましょう。ナビゲーション変更や主要機能追加の際には四半期ごとに見直します。
- ログイン保護されたページへのリンクを含めてしまう。 エージェントはダッシュボードに認証でアクセスすることができません。認証が必要なルートは除外し、公開ページのみリンクしてください。
実際に効果はあるのか?
2026年時点での正直な答えは「おそらくある、ただし留保あり」です。llms.txtの採用は広がっていますが、まだ部分的です。Anthropic、Mistral、そして複数のエージェントランタイムがサポートを表明しています。PerplexityとGoogleのAI Overviewsはどちらの方向にも正式なコミットメントをしていません。AIエージェントがllms.txtが存在する場合にフェッチし、回答の根拠として活用しているというアネクドータルなトラフィック帰属データは確認されていますが、公開された研究はまだ少ない状況です。
とはいえ、コストとベネフィットの計算は明快です。llms.txtの実装には30分と、CDN上の約2KBしかかかりません。デメリットはゼロです。読み取らないエージェントは静かに無視するだけであり、SEOのペナルティもなく、一度設置すれば保守負担もほとんどありません。AIエンジンにおいてllms.txtが強力なランキングシグナルになったとき、GEOプレイブックの中で最もコストの低い施策のひとつとして、AIでの引用可視性という意味のあるアップサイドをもたらします。私たちは導入しています。AI検索での認知向上を意識するチームのほとんどが導入しています。
GEOツールキットにおけるllms.txtの位置づけ
Generative Engine Optimization(GEO)とは、AIエンジン(Perplexity、ChatGPT、Claude、Google AI Overviews)があなたのカテゴリに関するプロンプトを処理する際に、あなたのコンテンツが引用されるよう最適化する取り組みです。llms.txtはGEOツールキットを構成する複数の要素のひとつです:
- llms.txt — エージェントにサイトの手動キュレーションされたマップを提供します(本記事)。
- 構造化データ(Schema.org JSON-LD) — HTMLに機械可読の情報を埋め込み、エンジンがArticle・FAQPage・HowTo・Organizationなどのマークアップを直接抽出できるようにします。
- FAQPage / HowTo / Article スキーマ — AIエンジンの抽出に最も有効な特定のスキーマタイプです。特にFAQは、エンジンが情報を合成する際の質問・回答の形式に直接対応しています。
- 引用されやすいコンテンツ — 具体的な数値、一次情報源、比較表、固有名詞。エンジンは曖昧な示唆より、根拠を示すページを好みます。
- 引用監査 — どのクエリでどのエンジンにあなたが引用されているか、競合と比較しながら継続的に計測することで、コンテンツの改善を直感ではなくエビデンスに基づいて行えるようにします。
最後の項目が、私たちのGenerative Engine Optimization Strategist(GEO戦略家)が毎週行っていることです。追跡クエリリストに基づき、Perplexity・ChatGPT・Claude・AI Overviewsにわたって引用を監査し、競合が引用される理由を分析し、SEOエキスパートへのリライトブリーフを作成します。llms.txtは一度の設定で完了しますが、引用監査は継続的な計測ループです。
今日、実装しましょう
llms.txtは、コストが極めて小さくデメリットがゼロという稀有な最適化施策です。まだ設置していないなら、今すぐ書きましょう。上記の例をテンプレートに使ってください。短く、手動キュレーション、説明は具体的に。サイトが変わったら四半期ごとに見直します。
引用の成果を実際に計測したい場合——変更後にAIエンジンがあなたを引用し始めるかどうかを確認したい場合——それはCeresのGEO Strategistロールが担います。毎週の引用監査、リライトブリーフ、変更前後の比較です。フルチームをお試しになりたい方は無料トライアルを始めてください。あるいは、このページをllms.txtのリファレンスとしてブックマークしておくだけでも構いません。
FAQ
- llms.txtファイルとは何ですか?
- llms.txtファイルは、ドメインのルート(https://yoursite.com/llms.txt)に設置するMarkdownドキュメントで、大規模言語モデルにサイトの重要なコンテンツを案内するキュレーションされたマップです。2024年9月にJeremy Howard(fast.ai)によって提案された仕様で、すべてのページをクロールしたりフルページのJavaScriptレンダリングのコストをかけることなく、AIエージェントがサイトの内容を把握するための単一ファイルのインデックスです。
- llms.txtはrobots.txtやsitemap.xmlと同じものですか?
- いいえ、異なります。robots.txtはクローラーにアクセスの可否を伝えるパーミッションファイルです。sitemap.xmlは検索エンジンのインデックス用に、すべてのURLをメタデータ付きで列挙した発見ファイルです。llms.txtは、最も重要なページへAIエージェントを案内するための人が書いたキュレーション型のナレーティブであり、既存の二つのファイルというよりREADMEに近いものです。三つは代替ではなく、互いを補完するものです。
- 現時点でAIエンジンは実際にllms.txtを読み取りますか?
- 2026年時点では、採用はまだ部分的です。Anthropic、Mistral、そして複数のエージェントランタイムがサポートを表明しています。PerplexityとGoogleのAI Overviewsは直接のコミットメントをしていませんが、複数の研究論文でllms.txtが有用なシグナルとして引用されています。現実的な答えは次の通りです。llms.txtの実装コストは低く(Markdownファイル一つ、インフラ不要)、リスクもゼロです。そのため、どのエンジンが公式に採用しているかに関わらず、AI検索での可視性を意識するほとんどのチームが実装しています。
- llms.txtとllms-full.txtの違いは何ですか?
- llms.txtはインデックスです。簡潔で1〜2ページ程度、人が読める形式で、キュレーションされたリンクを含みます。llms-full.txtはオプションの companion ファイルで、インデックスに掲載されたページの実際のコンテンツを単一のMarkdownドキュメントにフラット化したものです。エージェントがフルコーパスを必要とする場合に、クロールなしでワンリクエストで取得できます。両者は同じ llmstxt.org の仕様に含まれており、小規模なサイトは通常 llms.txt だけで十分ですが、コンテンツの多いサイトは両方の恩恵を受けられます。
- llms.txtファイルはどこに置けばよいですか?
- ドメインのルート——https://yoursite.com/llms.txt——に置いてください。仕様では明確に定められています。エージェントは /robots.txt と同様に、ベアルートの /llms.txt を探します。サブディレクトリへの設置(例:/docs/llms.txt)は仕様で認識されません。
- llms.txtファイルはどれくらいの長さにすべきですか?
- 簡潔にしてください。仕様では1ページのMarkdown——一般的に500〜2000語——を推奨しています。それ以上の内容は llms-full.txt またはリンク先のページ自体に置くべきです。llms.txtをナレッジベースではなくREADMEとして捉えてください。エージェントに追加のコンテキストを提供したい場合は、リンクで案内しましょう。インラインで貼り付けることは避けてください。