简溪

最新消息:【简溪】欢迎大家积极投稿,凡推荐到首页的投稿均有不定额红包哦!!!

网站robots文件的创建方法

网站运营课堂 柴叔博客 2018-01-17 65浏览 成都网站建设   成都网页设计   成都网站制作   网站运营管理


成都网站建设

网站建设做好之后需要在让搜索引擎发现并收录我们的网站页面,在这之前我们还需要考虑为网站创建一个robots.txt文件,这相当于是一个说明手册,告诉搜索引擎爬虫在您的网站上什么文件可以抓取,什么文件不能抓取。

文件写法很简单,介绍如下:

User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符

Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录

Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录

Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录

Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。

Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址

Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片

Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。

Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录

Allow: /tmp 这里定义是允许爬寻tmp的整个目录

Allow: .htm$ 仅允许访问以".htm"为后缀的URL。

Allow: .gif$ 允许抓取网页和gif格式图片。

例如:

网站robots文件制作

按照上述的写法把robots.txt文件准备就绪后,则可以像其他任何文件一样将其上传到网站的根目录即可。

继续浏览有关 网站运营课堂的文章

发表我的评论共有0条评论

昵称:

验证码:

匿名发表

文明社会,从理性发贴开始。谢绝地域攻击。
网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述。