1. 查看网站协议
地址栏输入:https://www.example.com/robots.txt
2. 常见输出:
User-agent: * (指定爬虫类型,* 表示所有爬虫。)
Disallow: /private/ (表示禁止抓取的路径。)
Allow: /public/ (表示允许抓取的路径(有时覆盖 Disallow)。)
1. 查看网站协议
地址栏输入:https://www.example.com/robots.txt
2. 常见输出:
User-agent: * (指定爬虫类型,* 表示所有爬虫。)
Disallow: /private/ (表示禁止抓取的路径。)
Allow: /public/ (表示允许抓取的路径(有时覆盖 Disallow)。)