無料AIクローラーチェッカー|ChatGPT・Claude・Gemini対応診断【AEO対策】
URLを入力するだけで、GPTBot・ClaudeBot・PerplexityBotなど12種類のAIクローラーがサイトにアクセスできるかを診断。robots.txt解析と実通信テストでCloudflareブロックも検出します。
URLを入力してボタンを押すだけ。robots.txt解析 + 実通信テストで30秒以内に診断します。
AEO(AI Engine Optimization)とAIクローラーとは?
AEO(AI Engine Optimization)とは、ChatGPT・Perplexity・Claude・Google AI OverviewなどのAI検索エンジンに自サイトのコンテンツを正しく認識・引用させるための最適化施策です。従来のSEOが「Googleの検索結果に上位表示させること」を目的としていたのに対し、AEOは「AIが質問に答える際に自サイトを引用させること」を目的とします。
AIクローラーとは、AIサービスがコンテンツを収集・学習・参照するために使用するボットプログラムです。大きく2種類に分かれます。学習用クローラー(GPTBot・ClaudeBot・CCBotなど)はAIモデルの学習データを収集し、検索・参照用クローラー(OAI-SearchBot・PerplexityBot・Claude-Userなど)はユーザーの質問に答える際にリアルタイムでページ内容を参照します。AEO対策の観点では、検索・参照用クローラーへのアクセス許可が特に重要です。
多くのサイトがCloudflareのBot FightモードやWAFルールにより、意図せずこれらのAIクローラーをブロックしています。その結果、AI検索での引用機会を失っていることに気づいていないケースが多数あります。本ツールは、robots.txtの設定と実際のHTTPアクセスの両面からAIクローラーのアクセス状況を診断します。
なぜAI検索クローラーを許可すべきか
AI検索エンジンの普及により、情報収集の導線が大きく変化しています。AI経由のオーガニック流入を獲得するには、AIクローラーへの適切なアクセス許可が前提条件です。
AI検索からの新規流入
ChatGPT Searchは月間1億人以上のユーザーが利用しており、PerplexityはGoogle代替として急速に普及しています。これらのAI検索がURLを引用・参照する際、OAI-SearchBot・PerplexityBotによるアクセスが必要です。これらをブロックしていると、AI検索結果にあなたのサイトが登場する機会を失います。2025年以降、AI検索経由のオーガニック流入は無視できない規模になっています。
ブランド・専門性の訴求
AIが質問に答える際に自サイトを引用することで、ブランド認知と専門性の訴求が可能になります。特に「業界のプロが推奨するツール」「信頼できる情報源」としてAIに認識されることは、従来のSEOでの権威性構築に匹敵する価値があります。Perplexityなどは引用元URLを明示するため、クリック流入にも直結します。
競合との差別化
まだ多くのサイトがAIクローラー対策を行っていません。早期にAEO対策を整えることで、競合他社が気づく前にAI検索での引用シェアを獲得できます。特に日本市場では、AI検索への意識がまだ低く、適切なrobots.txt設定とAEO最適化を行うだけで大きな差別化が可能です。AIクローラーへのアクセス許可は、そのための最初の必須ステップです。
本ツールが診断する12種類のAIクローラー一覧
AIクローラーには「モデル学習用」と「AI検索・参照用」の2種類があります。AEOスコアはAI検索・参照に直結するクローラーへのアクセス可否を重み付けして算出します。
| クローラー名 | 運営 | 用途 | AEO重要度 | 特記 |
|---|---|---|---|---|
| GPTBot | OpenAI | モデル学習 | 対象外 | ブロックしてもChatGPT検索に影響なし |
| OAI-SearchBot | OpenAI | ChatGPT Search | ★★★★ | ChatGPT検索でのURL引用に直結 |
| ChatGPT-User | OpenAI | ブラウジング | ★★★ | ChatGPTプラグイン・ブラウジング機能 |
| ClaudeBot | Anthropic | モデル学習 | 対象外 | ブロックしてもClaude検索に影響なし |
| Claude-User | Anthropic | ブラウジング | ★★★ | Claude検索連携でのAEO流入に関わる |
| PerplexityBot | Perplexity AI | AI検索 | ★★★★ | Perplexityの検索インデックス構築 |
| Google-Extended | Gemini学習 | ★ | Googlebot(AI Overview)とは別 | |
| Googlebot | AI Overview | ★★★ | SEO + Google AI Overviewの引用元 | |
| cohere-ai | Cohere | モデル学習 | 対象外 | B2B向けAI製品に使われる |
| Diffbot | Diffbot | ナレッジグラフ | ★★ | AI検索バックエンドに広く利用 |
| Bytespider | ByteDance | モデル学習 | 対象外 | TikTok親会社のAI学習クローラー |
| CCBot | Common Crawl | オープン学習データ | 対象外 | オープンソースAIモデルの学習元 |
★の数はAEOスコアへの寄与度を示します(★★★★=20pt, ★★★=15pt, ★★=10pt, ★=5pt)。
robots.txt でAIクローラーを制御する方法
robots.txtはサイトのルートディレクトリ(example.com/robots.txt)に設置するテキストファイルです。クローラーごとにアクセス許可・拒否を設定できます。
全AIクローラーを許可する場合(AEO最大化)
# 全クローラーを許可(デフォルト設定) User-agent: * Allow: /
robots.txtが存在しない場合も、全クローラーへのアクセスが許可されます。
学習はブロック・AI検索は許可する場合(推奨)
# GPTBot(OpenAI学習)をブロック User-agent: GPTBot Disallow: / # ClaudeBot(Anthropic学習)をブロック User-agent: ClaudeBot Disallow: / # ChatGPT Search / Perplexity は許可 User-agent: OAI-SearchBot Allow: / User-agent: PerplexityBot Allow: / # 残りは許可 User-agent: * Allow: /
このパターンではモデル学習をブロックしつつ、AI検索からの引用・流入は維持できます。
全AIクローラーをブロックする場合
# 主要AIクローラーを全ブロック User-agent: GPTBot Disallow: / User-agent: OAI-SearchBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: PerplexityBot Disallow: / User-agent: Google-Extended Disallow: / User-agent: CCBot Disallow: /
⚠️ AI検索からの流入・引用の機会を完全に失います。慎重に判断してください。
AIクローラーを完全許可するための4段階対応
robots.txtの設定だけでAIクローラーが通るとは限りません。Cloudflare・WAF・ファイアウォールによる多層ブロックが存在します。以下の順序で確認・対応してください。
robots.txt で明示的に Allow を設定
🟢 最優先最初のステップはrobots.txtでの許可設定です。AIクローラーのUser-Agentを明示的に許可するか、デフォルトの「User-agent: * / Allow: /」で全許可にします。robots.txtが見つからない(404)場合も全許可として扱われます。ただし、robots.txtは紳士協定であり、悪意あるクローラーは無視します。
Cloudflare ダッシュボードで AI Bots を Allow に変更
🟡 Cloudflare使用時CloudflareのSecurity > Bot Management > AI Crawlers設定でAIボットをAllowに変更します。Cloudflare Free〜Enterpriseすべてのプランで「Bot Fight Mode」がONになっていると、多くのAIクローラーが自動ブロックされます。ダッシュボードのSecurity > Settings > Bot Fight ModeをOFFにするか、個別ボットをAllowリストに追加してください。
WAF / Firewall ルールでUser-Agentブロックを除外
🟡 WAF設定時CloudflareのWAFカスタムルールや、サーバーのnginx・Apache設定で特定のUser-Agentをブロックしているケースがあります。WAFルールでAIクローラーのUser-AgentをAllowlist(除外リスト)に追加してください。nginxの場合は`if ($http_user_agent ~* "GPTBot|ClaudeBot") { return 200; }`のような除外設定が必要です。
llms.txt を追加してAI向けにサイト構造を提供
🔵 将来対応推奨llms.txtは2024年に提唱された新標準で、AIがサイト構造を効率的に理解できるよう設計されたMarkdown形式のファイルです。ドメインルート(/llms.txt)に設置することで、AnthropicのClaude・Perplexity AIがコンテンツ優先度を正確に把握できます。サービス名・主要ページのURL・各ページの説明を記載したMarkdownファイルを作成してください。SEOのsitemap.xmlのAI版と考えると理解しやすいです。
「学習はブロック、検索は許可」の戦略
コンテンツをAIモデルの学習データとして使われたくないが、AI検索からの流入・引用は獲得したいという場合、クローラーを用途別に選択的にブロックする戦略が有効です。
OpenAIのクローラーは用途別に分かれています。GPTBotはChatGPTのモデル学習データ収集用、OAI-SearchBotはChatGPT SearchがURLを引用する際に使用するクローラーです。この2つは独立しているため、GPTBotをブロックしてOAI-SearchBotを許可することで、「学習利用は防ぎつつChatGPT検索からの引用は維持する」という戦略が実現できます。
| 設定パターン | 学習ブロック | AI検索引用 | robots.txt 設定 |
|---|---|---|---|
| GPTBot ブロック / OAI-SearchBot 許可 | ✓ | ✓ | OpenAI学習防止 + ChatGPT Search維持 |
| ClaudeBot ブロック / Claude-User 許可 | ✓ | ✓ | Anthropic学習防止 + Claude検索維持 |
| Google-Extended ブロック / Googlebot 許可 | ✓ | ✓ | Gemini学習防止 + AI Overview維持 |
| CCBot・Bytespider ブロック / 検索系は全許可 | ✓ | ✓ | オープン学習防止 + AI検索フル対応 |
注意: 完全ブロック(全AIクローラーをDisallow)はAEO機会の完全喪失を意味します。上記のような選択的ブロックが現実的なバランスです。
他のAIクローラーチェックツールとの違い
Dark Visitors・AI Crawler Watch・一般的なrobots.txtバリデーターとの機能比較です。日本語対応・実通信テスト・AEOスコアが主な差別化ポイントです。
| 機能 | AIテスト番人 | Dark Visitors | AI Crawler Watch | robots.txt Validator |
|---|---|---|---|---|
| 完全日本語対応 | ✓ | ✗(英語のみ) | ✗(英語のみ) | ✗(英語のみ) |
| 対応クローラー数 | 12種類 | 20種類以上 | 8種類 | 5種類以下 |
| robots.txt + 実通信テスト両方 | ✓ | ✗(robots.txtのみ) | ✗(表示のみ) | ✗ |
| Cloudflare/WAFブロック検出 | ✓ | ✗ | ✗ | ✗ |
| AEOスコア算出 | ✓ | ✗ | ✗ | ✗ |
| 詳細な許可・拒否理由 | ✓ | △(一部) | ✗ | ✗ |
| 会員登録不要 | ✓ | ✓ | ✓ | ✓ |
| 無料利用 | ✓ | ✓(制限あり) | ✓ | ✓ |
よくある質問
AIクローラーを許可するとサーバー負荷は上がりますか?▼
AIクローラーのリクエスト頻度は一般的に検索エンジンのクローラーと同程度か、それ以下です。robots.txtのCrawl-delayディレクティブで1〜5秒のクロール間隔を設定することで、サーバー負荷を調整できます。大手AIサービス(OpenAI・Anthropic・Google)のクローラーはクロールレートを自動調整する機能を持っており、サイトに過大な負荷をかけないよう設計されています。ただし、CCBot(Common Crawl)は比較的高頻度でクロールするため、負荷が気になる場合はCrawl-delayを長めに設定することをお勧めします。
GPTBotだけブロックして他は許可することは可能ですか?▼
はい、robots.txtでは個別のUser-Agentごとにルールを設定できます。GPTBotのみをブロックする場合は「User-agent: GPTBot」「Disallow: /」と記述し、他のクローラーには「User-agent: *」「Allow: /」を設定します。ただし注意点があります。GPTBotをブロックするとOpenAIのモデル学習データとして使われなくなりますが、ChatGPT SearchはOAI-SearchBotを使用するため、GPTBotのブロックはChatGPT検索からの引用に影響しません。学習はブロックしつつAI検索からの流入は維持するという戦略が可能です。
Cloudflare の「AI Audit」機能は本ツールと何が違いますか?▼
CloudflareのAI Audit機能は、Cloudflare配下のサイトに実際にアクセスしてきたAIクローラーのトラフィックログを可視化し、ワンクリックでブロック・許可を管理できる機能です。一方、本ツールはCloudflare配下かどうかに関わらず、URLを入力するだけで外部からの視点でAIクローラーがアクセスできるかを診断します。CloudflareのAI AuditはDNSをCloudflare経由にする必要がありますが、本ツールはどのホスティング・CDNを使用しているサイトでも診断可能です。両ツールは補完的な関係にあります。
llms.txt と robots.txt はどう違いますか?▼
robots.txtはAIクローラーを含む全クローラーへのアクセス制御ファイルです(1994年策定)。一方、llms.txtは2024年に提唱された新しい標準で、AIが効率的にサイト内容を理解できるよう構造化した情報を提供するMarkdown形式のファイルです。robots.txtは「入ってよいか/ダメか」を制御するのに対し、llms.txtは「サイトの何が重要か・どう使ってほしいか」をAIに伝えるものです。llms.txtはまだ標準化の初期段階ですが、AnthropicのClaudeやPerplexity AIが参照を開始しており、AEO対策として早期に実装する価値があります。
著作権コンテンツがAIに学習されることが心配です▼
コンテンツを学習データとして使われたくない場合は、robots.txtでGPTBot・ClaudeBot・CCBot・Bytespiderをブロックすることが現実的な選択肢です。ただし、完全な防止は困難です。robots.txtは紳士協定であり、法的拘束力はありません。一方で、AI検索(ChatGPT Search・Perplexity・Google AI Overviews)からの引用・参照は著作権侵害にはならないとする法的解釈が一般的です。コンテンツ引用によるトラフィック流入のメリットと、学習利用のリスクを天秤にかけて判断することをお勧めします。
サブドメインごとに設定を分けられますか?▼
はい、robots.txtはドメイン・サブドメインごとに独立して設定します。たとえば、blog.example.comにはblog.example.com/robots.txtを設置し、api.example.comにはapi.example.com/robots.txtを設置します。メインドメインのrobots.txtはサブドメインには影響しません。WordPressのマルチサイトやサブドメイン構成のサービスでは、各サブドメインにrobots.txtを設置してAIクローラーポリシーを個別に管理することをお勧めします。本ツールもサブドメインURLを入力すれば、そのサブドメインのrobots.txtとアクセス状況を診断します。
入力したURLは保存されますか?▼
いいえ、入力したURLおよびチェック結果はサーバーには永続保存されません。チェック結果は10分間のみサーバーメモリに一時キャッシュされ(同一URLの連続チェック高速化のため)、その後自動削除されます。会員登録・ログインは不要で、チェックしたURLが第三者に公開されることもありません。
チェック結果はどのくらいの頻度で再確認すべきですか?▼
robots.txtの設定変更後や、Cloudflareのセキュリティルール変更後は必ず再確認してください。また、新しいAIサービスが登場した際(新しいクローラーがリリースされた際)も再チェックを推奨します。定期的な確認頻度としては、1〜3ヶ月に1回程度が適切です。サイトにCloudflareを使用している場合、Bot Fightモードの設定変更が意図せずAIクローラーをブロックすることがあるため、設定変更後は必ず確認してください。
関連ツール
今すぐ AI クローラー対応をチェック
URLを入力するだけ。AEO対策の第一歩を30秒で。
ページ上部のツールへ戻る