ToolCraft
Trang chủCông cụ AICông cụ lập trìnhChuyển đổi đơn vịCông cụ hình ảnh
ToolCraft

© 2026 ToolCraft. All rights reserved.

Chính sách Bảo mậtĐiều khoản Dịch vụ
DMCA.com Protection Status
Trang chủSEO & MarketingRobots.txt Tester

SEO & Marketing

Tạo JSON-LD SchemaTạo URL UTMOpen Graph PreviewSitemap ValidatorRobots.txt TesterKeyword Density Analyzer

Robots.txt Tester

Mô phỏng cách Googlebot và các crawler khác áp dụng luật Allow/Disallow từ robots.txt cho từng URL cụ thể.

Sitemap đã khai báo:
  • https://example.com/sitemap.xml
Kết quả test (12)
URLUAKết quảLuật khớp
https://example.com/Googlebot Cho phépL10: allow: /
https://example.com/admin/Googlebot Cho phépL10: allow: /
https://example.com/admin/public/loginGooglebot Cho phépL10: allow: /
https://example.com/private/file.pdfGooglebot Cho phépL10: allow: /
https://example.com/no-google/pageGooglebot ChặnL9: disallow: /no-google/
https://example.com/blog/post-1Googlebot Cho phépL10: allow: /
https://example.com/GPTBot ChặnL13: disallow: /
https://example.com/admin/GPTBot ChặnL13: disallow: /
https://example.com/admin/public/loginGPTBot ChặnL13: disallow: /
https://example.com/private/file.pdfGPTBot ChặnL13: disallow: /
https://example.com/no-google/pageGPTBot ChặnL13: disallow: /
https://example.com/blog/post-1GPTBot ChặnL13: disallow: /

Xem tất cả SEO & Marketing

Xem tất cả
100% offline
New

Tạo JSON-LD Schema

Tạo schema.org JSON-LD cho Article, Product, FAQ, LocalBusiness, Person, Event, Breadcrumbs. Form-based, dán sẵn.

SEO & Marketing
100% offline
New

Tạo URL UTM

Tạo URL có thể tracking với utm_source / utm_medium / utm_campaign. QR code tự sinh. Tương thích GA4 / Universal Analytics.

SEO & Marketing
100% offline
New

Open Graph Preview

Dán HTML và xem trước Facebook, Twitter, LinkedIn, Slack sẽ hiển thị thẻ chia sẻ của bạn ra sao.

SEO & Marketing
100% offline
New

Sitemap Validator

Kiểm tra cấu trúc sitemap.xml, định dạng lastmod, hreflang alternates và giới hạn số URL — chạy ngay trên trình duyệt.

SEO & Marketing

Robots.txt Tester là gì?

robots.txt là file tại /robots.txt trên mọi domain, nói cho crawler — Googlebot, Bingbot, GPTBot, ClaudeBot, và hàng trăm bot khác — biết đường dẫn nào chúng được request hay không. Nó dùng hai directive chính, Allow và Disallow, cộng với nhóm User-agent để giới hạn luật cho bot cụ thể. Luật match nghe đơn giản nhưng nhanh chóng phức tạp: precedence User-agent là "longest exact match thắng, rồi fallback về *"; precedence path là "pattern dài nhất thắng, hoà bằng thì Allow thắng"; và wildcard * với $ có ý nghĩa tinh tế. Một dấu / cuối đặt sai có thể leak thư mục /admin/ cho mọi search engine; một Disallow quá rộng có thể deindex toàn bộ site. Công cụ Robots.txt Tester này parse bất kỳ body robots.txt nào bạn dán, cho phép chọn một hay nhiều user-agent (Googlebot, GPTBot, ClaudeBot...) và danh sách URL, rồi hiển thị chính xác luật nào ở dòng nào sẽ match từng URL — implement theo spec match công khai của Google.

Cách precedence hoạt động

Theo spec Google: (1) Match UA — nhóm User-agent có tên là longest case-insensitive prefix match của tên crawler thắng; chỉ khi không nhóm cụ thể nào match thì User-agent: * mới áp dụng. (2) Match path — trong tất cả luật Allow/Disallow của nhóm đã chọn, luật có pattern dài nhất (không tính wildcard) thắng. Nếu hai pattern bằng độ cụ thể, Allow thắng Disallow. (3) Wildcard — * khớp bất kỳ chuỗi ký tự nào, và $ ở cuối pattern neo cuối URL. Crawl-delay không chuẩn và bị Google bỏ qua (nhưng Bing/Yandex tôn trọng).

FAQ