Question 1

robots.txtとは何ですか？どこに置きますか？

Accepted Answer

検索エンジンなどのクローラーに「どのページを巡回してよいか」を伝えるテキストファイルです。必ずサイトのルート直下（https://example.com/robots.txt）に設置します。サブディレクトリに置いても認識されません。

Question 2

AIクローラーを拒否するとどうなりますか？

Accepted Answer

GPTBotやClaudeBotなどのAI学習用クローラーに「収集しないでほしい」と伝えられます。主要なAI企業のクローラーはrobots.txtを尊重すると表明していますが、強制力のある仕組みではなく、従うかはクローラー側の自主性に依存します。また過去に収集済みのデータが消えるわけではありません。

Question 3

Disallowを書けば検索結果から消えますか？

Accepted Answer

いいえ。Disallowは「クロール（巡回）の拒否」であり、インデックス削除ではありません。他サイトからリンクされていればURLが検索結果に出続けることがあります。検索結果から確実に消したい場合は、クロールを許可した上でnoindexメタタグを使うか、Search Consoleの削除ツールを使います。

Question 4

sitemap.xmlは必ず必要ですか？

Accepted Answer

小規模サイトで内部リンクが整理されていれば必須ではありません。ただしページ数が多いサイト・新しいサイト・更新頻度が高いサイトでは、クローラーへの発見の手助けとして効果的です。作成したらSearch Consoleの「サイトマップ」メニューから送信しましょう。

Question 5

sitemap.xmlのサイズ制限はありますか？

Accepted Answer

1ファイルあたり50,000URL・50MB（非圧縮）までです。超える場合は複数のサイトマップに分割し、サイトマップインデックスでまとめます。本ツールは中小規模サイト向けで、1ファイル分を生成します。

Question 6

このツールは無料ですか？入力した内容は送信されますか？

Accepted Answer

完全無料・登録不要です。生成はすべてブラウザ内で行われ、入力したURLがサーバーに送信されることはありません。

robots.txt・sitemap.xml生成ツール

robots.txtとsitemap.xmlの役割

このツールの使い方

AIクローラー拒否の考え方

よくある間違い

よくある質問（FAQ）