如何禁止百度收录非首选域?

一. 百度site结果

May使用site指令在百度上粗略查询网站收录量时,发现一个问题,site:may90.com,发现搜索结果中竟然含有带www的may90.com。

百度site:may90.com文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

带www的may90.com竟然排在第一位;may90.com排在第二位。于是又在百度上搜索了一下,结果如下:
百度site:www.may90.com文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

这个结果让May特别地意外。May在建站初期就确定了网站的首选域,将may90.com作为首选域。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

二. 站长工具检查首选域

在站长工具中也能查询到将带www的域名跳转到不带www。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

站长工具检查首选域文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

三. 谷歌site结果

谷歌site:may90.com谷歌site:www.may90.com文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

Perfect~谷歌的这个结果让我特别满意,Google完全认可首选域的设置。难道百度不认可301跳转?对于百度,我也只能呵呵了。百度同时收录了带www的may90.com和may90.com这样极易造成大量重复页面的产生。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

四. 解决方法

1.在WordPress主题根目录新建wrobots.txt,代码如下:文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

User-Agent: *
Disallow: /

告诉搜索引擎禁止收录任何内容。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

2.May使用的是虚拟主机文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.may90.com [NC]
RewriteRule ^robots.txt wrobots.txt [L]

告诉搜索引擎带www的may90.com收录请参考wrobots.txt,禁止收录带www的may90.com的所有内容。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

3.百度投诉快照文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

将带有www的链接到百度投诉平台进行投诉。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

五.检查

1. 在浏览器地址栏输入:may90.com/robots.txt
may90.co的/robots.txt文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

2. 在浏览器地址栏输入如下,会直接跳转到may90.com/wrobots.txt
文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

上述写于2018年12月17日。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html


2018年12月20日,再去查看带www的may90.com的收录情况,只剩下1条记录了,且提示:文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

由于该网站的robots.txt文件存在限制指令(限制搜索引擎抓取),系统无法提供该页面的内容描述。文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

robots.txt文件存在限制指令文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html

说明带www的may90.com的robots.txt已经开始生效了。但是百度依然还会索引这个非首选域名。愤怒~文章源自MAY的SEO博客-https://may90.com/tech/preferred-domain.html


2018年12月21日,再次查看site:may90.com的结果,竟然找不到may90.com,百度是不是抽风了?

site:may90.com的结果

所以这种方法只适合新站点的设置,对于老站点还是无法屏蔽非首选域。

 

 

  • 我的微信
  • 扫一扫微信,添加好友
  • weinxin
  • 我的微信公众号
  • 关注公众号,了解最新动态
  • weinxin
  • 本文由 发表于 2018年12月17日
  • 转载请务必保留本文链接:https://may90.com/tech/preferred-domain.html
让百度彻底删除已收录的非首选域 SEO技术

让百度彻底删除已收录的非首选域

May之前有分享过一篇文章《如何禁止百度收录非首选域》, 但测试下来这种方法只适合新站点,像已经运营好几个月的MAY的SEO博客还是无法彻底屏蔽非首选域,百度同时收录了我的www站点和不带www的站点...
302和307重定向应该使用哪个重定向? SEO技术

302和307重定向应该使用哪个重定向?

302重定向和307重定向都可以在内容被临时移动时使用,但两者之间还是存在一些技术区别。那我应该使用哪个重定向呢? 在几乎很多情况下,302和307重定向都视为相同。但302重定向并不一定意味着客户端...
何时使用301重定向与302重定向? SEO技术

何时使用301重定向与302重定向?

有很多新手SEO优化人员可能对301重定向和302重定向两者之前的区别,以及何时使用会感到困惑。其实重定向是将一个URL转向到另一个URL的过程。 301重定向 301重定向(HTTP状态码301)传...
这些疯狂SEO技巧可提高网站排名? SEO技术

这些疯狂SEO技巧可提高网站排名?

对于网站而言,在搜索引擎的第二页和其他后续页上,基本上给网站判了“死刑”,没有人有时间或耐心滚动页面来搜索响应。我们都知道出现在搜索引擎首页并不是小菜一碟的事情,特别是您是在众多线上网站中想要争取那么...
HTTP状态码完整清单 SEO技术

HTTP状态码完整清单

Internet上有两个主要角色,即客户端和服务器。当您打开笔记本电脑并单击浏览器(例如Google Chrome)时,您正在通过Web客户端访问Internet。您正在请求发送到网络服务器以访问页面...
评论  2  访客  1  作者  1
    • 阿南 4

      301都解决不了,这种情况确实少见

        • MAY的SEO博客

          @ 阿南 你的是如何解决的呢?我的首选域是不带www的,但现在百度还收录着我的www呢 :cry:

      发表评论

      匿名网友 填写信息

      :?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

      确定