首页
视频直播
网站统计
网友留言
更多
高清壁纸
Search
1
站长网图床PHP源码V2.0 非第三方接口
812 阅读
2
Typecho博客系统付费查看内容插件
535 阅读
3
云短信轰炸PHP源码V2.4美化修复增强版
459 阅读
4
玖伍社区论坛系统源码
446 阅读
5
非常好看的HTML提示框代码,弹窗公告代码
330 阅读
站长杂谈
网络源码
程序源码
游戏源码
小程序源码
网站相关
网站SEO
网站推广
网站代码
系统插件
wordpress插件
typecho插件
phpcms插件
IDC测评
网站字体
主题模板
数据打包
登录
/
注册
找到
1
篇与
robots
相关的结果
2022-12-26
robots是什么?robots.txt怎么写?
一、什么是robots.txt? robots是网站和搜索引擎协议的纯文本文件,当一个搜索引擎蜘蛛来访问站点的时候,首先爬行检查根目录是否存在这个文件。如果存在的话,那么就会根据文件的内容来确定访问范围,如果没有的话蜘蛛就会沿着链接进行抓取,robots放在项目的根目录下。 202205031651541222548801.jpg图片 二、 robots.txt基本语法: 1、允许所有搜索引擎访问网站的所有部分,robots.txt写法如下 User-agent: * Disallow: 或者 User-agent: * Allow: / 注意: 1. 首个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。 2 、禁止所有搜索引擎访问网站的所有部分 robots.txt写法如下: User-agent: * Disallow: / 3 、只需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引 robots.txt写法如下: User-agent: * Disallow: /css/ Disallow: /admin/ Disallow: /images/ 注意:路径后面有斜杠和没有斜杠的区别:比如Disallow: /images/ 有斜杠是禁止抓取images整个文件夹,Disallow: /images 没有斜杠意思是凡是路径里面有/images关键词的都会被屏蔽 4、屏蔽一个文件夹/templets,但是又能抓取其中一个文件的写法:/templets/main robots.txt写法如下: User-agent: * Disallow: /templets Allow: /main 5、 禁止访问/html/目录下的所有以”.php”为后缀的URL(包含子目录) robots.txt写法如下: User-agent: * Disallow: /html/*.php 6、 仅允许访问某目录下某个后缀的文件,则使用“$” robots.txt写法如下: User-agent: * Allow: .html$ Disallow: / 7、禁止索引网站中所有的动态页面 比如这里限制的是有“?”的域名,例如index.php?id=1 robots.txt写法如下: User-agent: * Disallow: /? 8、 禁止搜索引擎抓取我们网站上的所有图片(如果你的网站使用其他后缀的图片名称,在这里也可以直接添加) 有些时候,我们为了节省服务器资源,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外,还 可以采取直接屏蔽图片后缀名的方式。 robots.txt写法如下: User-agent: * Disallow: .jpg$ Disallow: .jpeg$ Disallow: .gif$ Disallow: .png$ Disallow: .bmp$ 202205031651541236239539.jpg图片 三、写robots.txt要注意的地方: 1)、 首个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。 2.)、斜杠:/ 代表整个网站 3)、如果“/”后面多了一个空格,则屏蔽整个网站 4)、不要禁止正常的内容 5)、生效时间是几天到两个月 202205031651541354317365.jpg图片 四、robots.txt文件对网站优化有什么作用? 1、疾速增加网站权重和拜访量; 2、制止某些文件被查找引擎索引,能够节约服务器带宽和网站拜访速度; 3、为查找引擎供给一个简洁明了的索引环境
站长杂谈
# robots
ZIy博客网
3年前
0
25
3