悦考网游:值得大家信赖的游戏下载站!
发布时间:2021-06-28 15:16:35来源:悦考网游作者:悦考网游
说明:我们有时候页面有些内容由于某些因素,都要防止被搜索引擎收录,而禁止搜索引擎收录比较简单的办法是在Robots.txt
里设置规则,Robots
协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol
),网站通过Robots
协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。这里说下方法。
这里以WordPress
博客网站为例,在网站根目录Robots.txt
里添加如下规则:
User-agent: * Disallow: /wp-admin/ Disallow: /wp-content/ Disallow: /wp-includes/ Disallow: /*/comment-page-* Disallow: /*?replytocom=* Disallow: /category/*/page/ Disallow: /tag/*/page/ Disallow: /*/trackback Disallow: /feed Disallow: /*/feed Disallow: /comments/feed Disallow: /?s=* Disallow: /*/?s=*\ Disallow: /attachment/
下面分别解释一下各项的作用:
1、Disallow: /wp-admin/、Disallow: /wp-content/和Disallow: /wp-includes/ 用于告诉搜索引擎不要抓取后台程序文件页面。 2、Disallow: /*/comment-page-*和Disallow: /*?replytocom=* 禁止搜索引擎抓取评论分页等相关链接。 3、Disallow: /category/*/page/和Disallow: /tag/*/page/ 禁止搜索引擎抓取收录分类和标签的分页。 4、Disallow: /*/trackback 禁止搜索引擎抓取收录trackback等垃圾信息 5、Disallow: /feed、Disallow: /*/feed和Disallow: /comments/feed 禁止搜索引擎抓取收录feed链接,feed只用于订阅本站,与搜索引擎无关。 6、Disallow: /?s=*和Disallow: /*/?s=*\ 禁止搜索引擎抓取站内搜索结果 7、Disallow: /attachment/ 禁止搜索引擎抓取附件页面,比如毫无意义的图片附件页面。
上面只是些基本的写法,当然还有很多,不过够用了。当然像Typecho
、Emlog
,Zblog
这些博客就自己看着办,方法一样。
王牌战士幽灵实战技巧讲解
古今江湖童姥牌组搭配使用技巧攻略
王者荣耀王者模拟战即将上线 王者模拟战玩法介绍
王牌战士团战如何切入详细讲解
王牌战士据点占领怎么玩 游戏模式介绍
神雕侠侣2手游氪金玩家消费指南
和平精英通讯塔是什么 和平精英通讯塔玩法详细解析
崩坏3精英工坊新加入了什么武器圣痕 精英工坊新武器圣痕一览
第五人格Blackjack新模式玩法简介 官方新玩法游戏流程及规则
梦三国
角色扮演
征途永恒
角色扮演
永恒纪元
角色扮演
王者荣耀
角色扮演
斗罗大陆手游
角色扮演
和平精英
枪战射击
精灵盛典
角色扮演
一刀传世
角色扮演
坠落星界
其它游戏