http://hi.baidu.com/robots.txt
User-agent: Baiduspider Disallow: User-agent: Googlebot Disallow: User-agent: Disallow: / User-agent: MSNBot Allow: /
本文介绍了一个网站中robots.txt文件的基本结构及用法。通过解析不同的搜索引擎爬虫User-agent及其对应的Disallow指令,阐述了如何禁止特定的搜索引擎抓取网站的部分内容。同时也提到了允许抓取的情况。
http://hi.baidu.com/robots.txt
User-agent: Baiduspider Disallow: User-agent: Googlebot Disallow: User-agent: Disallow: / User-agent: MSNBot Allow: /
2257
2292
1364

被折叠的 条评论
为什么被折叠?