利用Robots.txt优化你的WordPress站点

2017年3月8日18:38:23wordpress主题百科知道评论7,0821阅读模式

很多建站新手对robots.txt文件的重要作用不是很清楚，利用这篇文章普及一下WordPress站点robots.txt文件编写知识。
Robots协议（也称为爬虫协议、机器人协议等）的全称是“网络爬虫排除标准”（Robots Exclusion Protocol），网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。
搜索引擎机器人访问网站时，首先会寻找站点根目录有没有 robots.txt文件，如果有这个文件就根据文件的内容确定收录范围，如果没有就按默认访问以及收录所有页面。另外，当搜索蜘蛛发现不存在robots.txt文件时，会产生一个404错误日志在服务器上，从而增加服务器的负担，因此为站点添加一个robots.txt文件还是很重要的。
知道Robots协议的作用后，下面具体说一下WordPress站点如何编写robots.txt文件。
WordPress站点默认在浏览器中输入：http://你的域名/robots.txt，会显示如下内容：

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/

这是由WordPress自动生成的，意思是告诉搜索引擎不要抓取后台程序文件。
但这是远远不够的，比较完整的WordPress站点robots.txt文件内容如下：

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /*/comment-page-*
Disallow: /*?replytocom=*
Disallow: /category/*/page/
Disallow: /tag/*/page/
Disallow: /*/trackback
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /?s=*
Disallow: /*/?s=*\
Disallow: /*?*
Disallow: /attachment/

使用方法：新建一个名称为robots.txt文本文件，将上面的内容放进去，然后上传到网站根目录即可。

下面分别解释一下各项的作用：
1、Disallow: /wp-admin/、Disallow: /wp-content/和Disallow: /wp-includes/
用于告诉搜索引擎不要抓取后台程序文件页面。
2、Disallow: /*/comment-page-*和Disallow: /*?replytocom=*
禁止搜索引擎抓取评论分页等相关链接。
3、Disallow: /category/*/page/和Disallow: /tag/*/page/
禁止搜索引擎抓取收录分类和标签的分页。
4、Disallow: /*/trackback
禁止搜索引擎抓取收录trackback等垃圾信息
5、Disallow: /feed、Disallow: /*/feed和Disallow: /comments/feed
禁止搜索引擎抓取收录feed链接，feed只用于订阅本站，与搜索引擎无关。
6、Disallow: /?s=*和Disallow: /*/?s=*\
禁止搜索引擎抓取站内搜索结果
7、Disallow: /*?*
禁止搜索抓取动态页面
8、Disallow: /attachment/
禁止搜索引擎抓取附件页面，比如毫无意义的图片附件页面。
上面只是些基本的写法，当然还有很多，不过够用了。

历史上的今天

3 月

利用Robots.txt优化你的WordPress站点

历史上的今天

WordPress后台更新出现PCLZIP_ERR_BAD_FORMAT (-10) : Unable to find End of Central Dir Record signature错误的另类解决办法

wordpress英文主题怎样汉化成中文主题？

Discuz数据表详解（二）

CSS3 定价表 [1.2版]

OpenLiteSpeed 中rolling Size设置是指什么

openlitespeed+litespeedcache插件，如果卸载了之后，网站还存在缓存文件。怎么办呢？

彻底解决AMD显卡win10开机黑屏问题

宝塔面板设置Docker加速站提示错误：全局配置文件有误，请检查Expecting value:line 1 column 1(char 0)解决方法

/var/log/maillog日志太大占满/var空间如何清理

/.well-known/traffic-advice＂ failed (2: No such file or directory), client: 关于这个问题

华硕路由器的ddns用不了，还有哪个可以用，备选替代选择

/tmp/lshttpd/swap 占用系统盘空间 OpenLiteSpeed 移动交换目录

Installing CyberPanel 安装 CyberPanel

用 Laravel 吗，从 Nginx 切换到 OpenLiteSpeed 的那种

加载中...

发表评论

热门搜索

历史上的今天

发表评论