robots.txt 测试器

URL	UA	结果	匹配规则
https://example.com/	Googlebot	允许	L10: allow: /
https://example.com/admin/	Googlebot	允许	L10: allow: /
https://example.com/admin/public/login	Googlebot	允许	L10: allow: /
https://example.com/private/file.pdf	Googlebot	允许	L10: allow: /
https://example.com/no-google/page	Googlebot	阻止	L9: disallow: /no-google/
https://example.com/blog/post-1	Googlebot	允许	L10: allow: /
https://example.com/	GPTBot	阻止	L13: disallow: /
https://example.com/admin/	GPTBot	阻止	L13: disallow: /
https://example.com/admin/public/login	GPTBot	阻止	L13: disallow: /
https://example.com/private/file.pdf	GPTBot	阻止	L13: disallow: /
https://example.com/no-google/page	GPTBot	阻止	L13: disallow: /
https://example.com/blog/post-1	GPTBot	阻止	L13: disallow: /

URL

结果

匹配规则

https://example.com/

Googlebot

允许

L10: allow: /

https://example.com/admin/

Googlebot

允许

L10: allow: /

https://example.com/admin/public/login

Googlebot

允许

L10: allow: /

https://example.com/private/file.pdf

Googlebot

允许

L10: allow: /

https://example.com/no-google/page

Googlebot

阻止

L9: disallow: /no-google/

https://example.com/blog/post-1

Googlebot

允许

L10: allow: /

https://example.com/

GPTBot

阻止

L13: disallow: /

https://example.com/admin/

GPTBot

阻止

L13: disallow: /

https://example.com/admin/public/login

GPTBot

阻止

L13: disallow: /

https://example.com/private/file.pdf

GPTBot

阻止

L13: disallow: /

https://example.com/no-google/page

GPTBot

阻止

L13: disallow: /

https://example.com/blog/post-1

GPTBot

阻止

L13: disallow: /

URL	UA	结果	匹配规则
https://example.com/	Googlebot	允许	L10: allow: /
https://example.com/admin/	Googlebot	允许	L10: allow: /
https://example.com/admin/public/login	Googlebot	允许	L10: allow: /
https://example.com/private/file.pdf	Googlebot	允许	L10: allow: /
https://example.com/no-google/page	Googlebot	阻止	L9: disallow: /no-google/
https://example.com/blog/post-1	Googlebot	允许	L10: allow: /
https://example.com/	GPTBot	阻止	L13: disallow: /
https://example.com/admin/	GPTBot	阻止	L13: disallow: /
https://example.com/admin/public/login	GPTBot	阻止	L13: disallow: /
https://example.com/private/file.pdf	GPTBot	阻止	L13: disallow: /
https://example.com/no-google/page	GPTBot	阻止	L13: disallow: /
https://example.com/blog/post-1	GPTBot	阻止	L13: disallow: /

robots.txt 是每个域名 /robots.txt 路径上的文件,告诉爬虫 — Googlebot、Bingbot、GPTBot、ClaudeBot 等数百个机器人 — 可以或不可以请求哪些路径。主要使用 Allow 与 Disallow 两条指令,以及为特定机器人限定规则的 User-agent 分组。匹配规则乍看直观,实际上很快就变得棘手: User-agent 优先级是「最长精确匹配胜出,否则回退到 *」;路径优先级是「最长模式胜出,同等时 Allow 胜出 Disallow」;通配符 * 与 $ 也有微妙含义。一个放错位置的末尾斜杠可能把 /admin/ 目录泄露给所有搜索引擎;过于宽泛的 Disallow 可能让整个站点从索引中消失。本 Robots.txt 测试器解析您粘贴的 robots.txt 内容,可选择一个或多个 User-Agent(Googlebot、GPTBot、ClaudeBot 等)与 URL 列表,精确展示每个 URL 会匹配第几行的哪条规则 — 完全遵循 Google 公开的匹配规范。

robots.txt 测试器

查看全部 SEO 与营销

JSON-LD Schema 生成器

UTM 链接构建器

Open Graph 预览

站点地图验证器

robots.txt 测试器

查看全部 SEO 与营销

JSON-LD Schema 生成器

UTM 链接构建器

Open Graph 预览

站点地图验证器

Robots.txt 测试器是什么?

优先级如何运作

FAQ