专业 robots.txt 生成器

1. 基础全局配置

默认抓取延迟 (Crawl-delay)

站点地图 URL (Sitemap)

2. 抓取规则定义 (Allow/Disallow)

常用预设项目:

robots.txt 实时预览

💡 提示: robots.txt 文件必须放在网站的根目录下。

例如: https://example.com/robots.txt

什么是 robots.txt？

它是爬虫访问网站时查看的第一个文件。它告诉搜索引擎（如 Google、Baidu）哪些页面可以抓取，哪些不可以。它虽然不是强制命令，但大多数主流爬虫都会严格遵守。

常见误区