如何禁止百度收录非首选域？- MAY的SEO博客

2018年12月17日SEO技术214,03712

一. 百度site结果

May使用site指令在百度上粗略查询网站收录量时，发现一个问题，site:may90.com，发现搜索结果中竟然含有带www的may90.com。

文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

带www的may90.com竟然排在第一位；may90.com排在第二位。于是又在百度上搜索了一下，结果如下：
文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

这个结果让May特别地意外。May在建站初期就确定了网站的首选域，将may90.com作为首选域。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

二. 站长工具检查首选域

在站长工具中也能查询到将带www的域名跳转到不带www。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

三. 谷歌site结果

文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

Perfect~谷歌的这个结果让我特别满意，Google完全认可首选域的设置。难道百度不认可301跳转？对于百度，我也只能呵呵了。百度同时收录了带www的may90.com和may90.com这样极易造成大量重复页面的产生。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

四. 解决方法

1.在WordPress主题根目录新建wrobots.txt，代码如下：文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

User-Agent: *
Disallow: /

告诉搜索引擎禁止收录任何内容。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

2.May使用的是虚拟主机文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.may90.com [NC]
RewriteRule ^robots.txt wrobots.txt [L]

告诉搜索引擎带www的may90.com收录请参考wrobots.txt，禁止收录带www的may90.com的所有内容。

3.百度投诉快照

将带有www的链接到百度投诉平台进行投诉。

五．检查

1. 在浏览器地址栏输入：may90.com/robots.txt

2. 在浏览器地址栏输入如下，会直接跳转到may90.com/wrobots.txt

上述写于2018年12月17日。

2018年12月20日，再去查看带www的may90.com的收录情况，只剩下1条记录了，且提示：

由于该网站的robots.txt文件存在限制指令（限制搜索引擎抓取），系统无法提供该页面的内容描述。

说明带www的may90.com的robots.txt已经开始生效了。但是百度依然还会索引这个非首选域名。愤怒~

2018年12月21日，再次查看site:may90.com的结果，竟然找不到may90.com，百度是不是抽风了？

所以这种方法只适合新站点的设置，对于老站点还是无法屏蔽非首选域。

我的微信

扫一扫微信，添加好友

我的微信

我的微信公众号

关注公众号，了解最新动态

我的公众号

如何禁止百度收录非首选域？

一. 百度site结果

二. 站长工具检查首选域

三. 谷歌site结果

四. 解决方法

五．检查

让百度彻底删除已收录的非首选域

302和307重定向应该使用哪个重定向？

何时使用301重定向与302重定向？

这些疯狂SEO技巧可提高网站排名？

HTTP状态码完整清单

[网站提交入口]搜索引擎收录网站提交入口

黑帽SEO是什么？常见黑帽SEO技术有哪些？

首选域是什么？如何设置网站首选域？

301 302 307重定向指南

404错误页面返回200状态码，如何处理？

如何长期保持网站内容新鲜和最新？

加载中...