無料AIクローラーチェッカー|ChatGPT・Claude・Gemini対応診断【AEO対策】

URLを入力するだけで、GPTBot・ClaudeBot・PerplexityBotなど12種類のAIクローラーがサイトにアクセスできるかを診断。robots.txt解析と実通信テストでCloudflareブロックも検出します。

完全無料🤖 12種類のAIクローラー対応🛡️ Cloudflareブロック検出📊 AEOスコア算出📋 会員登録不要

URLを入力してボタンを押すだけ。robots.txt解析 + 実通信テストで30秒以内に診断します。

AEO(AI Engine Optimization)とAIクローラーとは?

AEO(AI Engine Optimization)とは、ChatGPT・Perplexity・Claude・Google AI OverviewなどのAI検索エンジンに自サイトのコンテンツを正しく認識・引用させるための最適化施策です。従来のSEOが「Googleの検索結果に上位表示させること」を目的としていたのに対し、AEOは「AIが質問に答える際に自サイトを引用させること」を目的とします。

AIクローラーとは、AIサービスがコンテンツを収集・学習・参照するために使用するボットプログラムです。大きく2種類に分かれます。学習用クローラー(GPTBot・ClaudeBot・CCBotなど)はAIモデルの学習データを収集し、検索・参照用クローラー(OAI-SearchBot・PerplexityBot・Claude-Userなど)はユーザーの質問に答える際にリアルタイムでページ内容を参照します。AEO対策の観点では、検索・参照用クローラーへのアクセス許可が特に重要です。

多くのサイトがCloudflareのBot FightモードやWAFルールにより、意図せずこれらのAIクローラーをブロックしています。その結果、AI検索での引用機会を失っていることに気づいていないケースが多数あります。本ツールは、robots.txtの設定と実際のHTTPアクセスの両面からAIクローラーのアクセス状況を診断します。

なぜAI検索クローラーを許可すべきか

AI検索エンジンの普及により、情報収集の導線が大きく変化しています。AI経由のオーガニック流入を獲得するには、AIクローラーへの適切なアクセス許可が前提条件です。

🔍

AI検索からの新規流入

ChatGPT Searchは月間1億人以上のユーザーが利用しており、PerplexityはGoogle代替として急速に普及しています。これらのAI検索がURLを引用・参照する際、OAI-SearchBot・PerplexityBotによるアクセスが必要です。これらをブロックしていると、AI検索結果にあなたのサイトが登場する機会を失います。2025年以降、AI検索経由のオーガニック流入は無視できない規模になっています。

📢

ブランド・専門性の訴求

AIが質問に答える際に自サイトを引用することで、ブランド認知と専門性の訴求が可能になります。特に「業界のプロが推奨するツール」「信頼できる情報源」としてAIに認識されることは、従来のSEOでの権威性構築に匹敵する価値があります。Perplexityなどは引用元URLを明示するため、クリック流入にも直結します。

競合との差別化

まだ多くのサイトがAIクローラー対策を行っていません。早期にAEO対策を整えることで、競合他社が気づく前にAI検索での引用シェアを獲得できます。特に日本市場では、AI検索への意識がまだ低く、適切なrobots.txt設定とAEO最適化を行うだけで大きな差別化が可能です。AIクローラーへのアクセス許可は、そのための最初の必須ステップです。

本ツールが診断する12種類のAIクローラー一覧

AIクローラーには「モデル学習用」と「AI検索・参照用」の2種類があります。AEOスコアはAI検索・参照に直結するクローラーへのアクセス可否を重み付けして算出します。

クローラー名運営用途AEO重要度特記
GPTBotOpenAIモデル学習対象外ブロックしてもChatGPT検索に影響なし
OAI-SearchBotOpenAIChatGPT Search★★★★ChatGPT検索でのURL引用に直結
ChatGPT-UserOpenAIブラウジング★★★ChatGPTプラグイン・ブラウジング機能
ClaudeBotAnthropicモデル学習対象外ブロックしてもClaude検索に影響なし
Claude-UserAnthropicブラウジング★★★Claude検索連携でのAEO流入に関わる
PerplexityBotPerplexity AIAI検索★★★★Perplexityの検索インデックス構築
Google-ExtendedGoogleGemini学習Googlebot(AI Overview)とは別
GooglebotGoogleAI Overview★★★SEO + Google AI Overviewの引用元
cohere-aiCohereモデル学習対象外B2B向けAI製品に使われる
DiffbotDiffbotナレッジグラフ★★AI検索バックエンドに広く利用
BytespiderByteDanceモデル学習対象外TikTok親会社のAI学習クローラー
CCBotCommon Crawlオープン学習データ対象外オープンソースAIモデルの学習元

★の数はAEOスコアへの寄与度を示します(★★★★=20pt, ★★★=15pt, ★★=10pt, ★=5pt)。

robots.txt でAIクローラーを制御する方法

robots.txtはサイトのルートディレクトリ(example.com/robots.txt)に設置するテキストファイルです。クローラーごとにアクセス許可・拒否を設定できます。

全AIクローラーを許可する場合(AEO最大化)

# 全クローラーを許可(デフォルト設定)
User-agent: *
Allow: /

robots.txtが存在しない場合も、全クローラーへのアクセスが許可されます。

学習はブロック・AI検索は許可する場合(推奨)

# GPTBot(OpenAI学習)をブロック
User-agent: GPTBot
Disallow: /

# ClaudeBot(Anthropic学習)をブロック
User-agent: ClaudeBot
Disallow: /

# ChatGPT Search / Perplexity は許可
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

# 残りは許可
User-agent: *
Allow: /

このパターンではモデル学習をブロックしつつ、AI検索からの引用・流入は維持できます。

全AIクローラーをブロックする場合

# 主要AIクローラーを全ブロック
User-agent: GPTBot
Disallow: /

User-agent: OAI-SearchBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: PerplexityBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: CCBot
Disallow: /

⚠️ AI検索からの流入・引用の機会を完全に失います。慎重に判断してください。

AIクローラーを完全許可するための4段階対応

robots.txtの設定だけでAIクローラーが通るとは限りません。Cloudflare・WAF・ファイアウォールによる多層ブロックが存在します。以下の順序で確認・対応してください。

1

robots.txt で明示的に Allow を設定

🟢 最優先

最初のステップはrobots.txtでの許可設定です。AIクローラーのUser-Agentを明示的に許可するか、デフォルトの「User-agent: * / Allow: /」で全許可にします。robots.txtが見つからない(404)場合も全許可として扱われます。ただし、robots.txtは紳士協定であり、悪意あるクローラーは無視します。

2

Cloudflare ダッシュボードで AI Bots を Allow に変更

🟡 Cloudflare使用時

CloudflareのSecurity > Bot Management > AI Crawlers設定でAIボットをAllowに変更します。Cloudflare Free〜Enterpriseすべてのプランで「Bot Fight Mode」がONになっていると、多くのAIクローラーが自動ブロックされます。ダッシュボードのSecurity > Settings > Bot Fight ModeをOFFにするか、個別ボットをAllowリストに追加してください。

3

WAF / Firewall ルールでUser-Agentブロックを除外

🟡 WAF設定時

CloudflareのWAFカスタムルールや、サーバーのnginx・Apache設定で特定のUser-Agentをブロックしているケースがあります。WAFルールでAIクローラーのUser-AgentをAllowlist(除外リスト)に追加してください。nginxの場合は`if ($http_user_agent ~* "GPTBot|ClaudeBot") { return 200; }`のような除外設定が必要です。

4

llms.txt を追加してAI向けにサイト構造を提供

🔵 将来対応推奨

llms.txtは2024年に提唱された新標準で、AIがサイト構造を効率的に理解できるよう設計されたMarkdown形式のファイルです。ドメインルート(/llms.txt)に設置することで、AnthropicのClaude・Perplexity AIがコンテンツ優先度を正確に把握できます。サービス名・主要ページのURL・各ページの説明を記載したMarkdownファイルを作成してください。SEOのsitemap.xmlのAI版と考えると理解しやすいです。

「学習はブロック、検索は許可」の戦略

コンテンツをAIモデルの学習データとして使われたくないが、AI検索からの流入・引用は獲得したいという場合、クローラーを用途別に選択的にブロックする戦略が有効です。

OpenAIのクローラーは用途別に分かれています。GPTBotはChatGPTのモデル学習データ収集用、OAI-SearchBotはChatGPT SearchがURLを引用する際に使用するクローラーです。この2つは独立しているため、GPTBotをブロックしてOAI-SearchBotを許可することで、「学習利用は防ぎつつChatGPT検索からの引用は維持する」という戦略が実現できます。

設定パターン学習ブロックAI検索引用robots.txt 設定
GPTBot ブロック / OAI-SearchBot 許可OpenAI学習防止 + ChatGPT Search維持
ClaudeBot ブロック / Claude-User 許可Anthropic学習防止 + Claude検索維持
Google-Extended ブロック / Googlebot 許可Gemini学習防止 + AI Overview維持
CCBot・Bytespider ブロック / 検索系は全許可オープン学習防止 + AI検索フル対応

注意: 完全ブロック(全AIクローラーをDisallow)はAEO機会の完全喪失を意味します。上記のような選択的ブロックが現実的なバランスです。

他のAIクローラーチェックツールとの違い

Dark Visitors・AI Crawler Watch・一般的なrobots.txtバリデーターとの機能比較です。日本語対応・実通信テスト・AEOスコアが主な差別化ポイントです。

機能AIテスト番人Dark
Visitors
AI Crawler
Watch
robots.txt
Validator
完全日本語対応✗(英語のみ)✗(英語のみ)✗(英語のみ)
対応クローラー数12種類20種類以上8種類5種類以下
robots.txt + 実通信テスト両方✗(robots.txtのみ)✗(表示のみ)
Cloudflare/WAFブロック検出
AEOスコア算出
詳細な許可・拒否理由△(一部)
会員登録不要
無料利用✓(制限あり)

よくある質問

AIクローラーを許可するとサーバー負荷は上がりますか?

AIクローラーのリクエスト頻度は一般的に検索エンジンのクローラーと同程度か、それ以下です。robots.txtのCrawl-delayディレクティブで1〜5秒のクロール間隔を設定することで、サーバー負荷を調整できます。大手AIサービス(OpenAI・Anthropic・Google)のクローラーはクロールレートを自動調整する機能を持っており、サイトに過大な負荷をかけないよう設計されています。ただし、CCBot(Common Crawl)は比較的高頻度でクロールするため、負荷が気になる場合はCrawl-delayを長めに設定することをお勧めします。

GPTBotだけブロックして他は許可することは可能ですか?

はい、robots.txtでは個別のUser-Agentごとにルールを設定できます。GPTBotのみをブロックする場合は「User-agent: GPTBot」「Disallow: /」と記述し、他のクローラーには「User-agent: *」「Allow: /」を設定します。ただし注意点があります。GPTBotをブロックするとOpenAIのモデル学習データとして使われなくなりますが、ChatGPT SearchはOAI-SearchBotを使用するため、GPTBotのブロックはChatGPT検索からの引用に影響しません。学習はブロックしつつAI検索からの流入は維持するという戦略が可能です。

Cloudflare の「AI Audit」機能は本ツールと何が違いますか?

CloudflareのAI Audit機能は、Cloudflare配下のサイトに実際にアクセスしてきたAIクローラーのトラフィックログを可視化し、ワンクリックでブロック・許可を管理できる機能です。一方、本ツールはCloudflare配下かどうかに関わらず、URLを入力するだけで外部からの視点でAIクローラーがアクセスできるかを診断します。CloudflareのAI AuditはDNSをCloudflare経由にする必要がありますが、本ツールはどのホスティング・CDNを使用しているサイトでも診断可能です。両ツールは補完的な関係にあります。

llms.txt と robots.txt はどう違いますか?

robots.txtはAIクローラーを含む全クローラーへのアクセス制御ファイルです(1994年策定)。一方、llms.txtは2024年に提唱された新しい標準で、AIが効率的にサイト内容を理解できるよう構造化した情報を提供するMarkdown形式のファイルです。robots.txtは「入ってよいか/ダメか」を制御するのに対し、llms.txtは「サイトの何が重要か・どう使ってほしいか」をAIに伝えるものです。llms.txtはまだ標準化の初期段階ですが、AnthropicのClaudeやPerplexity AIが参照を開始しており、AEO対策として早期に実装する価値があります。

著作権コンテンツがAIに学習されることが心配です

コンテンツを学習データとして使われたくない場合は、robots.txtでGPTBot・ClaudeBot・CCBot・Bytespiderをブロックすることが現実的な選択肢です。ただし、完全な防止は困難です。robots.txtは紳士協定であり、法的拘束力はありません。一方で、AI検索(ChatGPT Search・Perplexity・Google AI Overviews)からの引用・参照は著作権侵害にはならないとする法的解釈が一般的です。コンテンツ引用によるトラフィック流入のメリットと、学習利用のリスクを天秤にかけて判断することをお勧めします。

サブドメインごとに設定を分けられますか?

はい、robots.txtはドメイン・サブドメインごとに独立して設定します。たとえば、blog.example.comにはblog.example.com/robots.txtを設置し、api.example.comにはapi.example.com/robots.txtを設置します。メインドメインのrobots.txtはサブドメインには影響しません。WordPressのマルチサイトやサブドメイン構成のサービスでは、各サブドメインにrobots.txtを設置してAIクローラーポリシーを個別に管理することをお勧めします。本ツールもサブドメインURLを入力すれば、そのサブドメインのrobots.txtとアクセス状況を診断します。

入力したURLは保存されますか?

いいえ、入力したURLおよびチェック結果はサーバーには永続保存されません。チェック結果は10分間のみサーバーメモリに一時キャッシュされ(同一URLの連続チェック高速化のため)、その後自動削除されます。会員登録・ログインは不要で、チェックしたURLが第三者に公開されることもありません。

チェック結果はどのくらいの頻度で再確認すべきですか?

robots.txtの設定変更後や、Cloudflareのセキュリティルール変更後は必ず再確認してください。また、新しいAIサービスが登場した際(新しいクローラーがリリースされた際)も再チェックを推奨します。定期的な確認頻度としては、1〜3ヶ月に1回程度が適切です。サイトにCloudflareを使用している場合、Bot Fightモードの設定変更が意図せずAIクローラーをブロックすることがあるため、設定変更後は必ず確認してください。

関連ツール

今すぐ AI クローラー対応をチェック

URLを入力するだけ。AEO対策の第一歩を30秒で。

ページ上部のツールへ戻る