在SEO优化工作中,我们常常听到:网站被“百度镜像”了。这是怎么一回事呢?镜像,原意是说物体在镜面中所成之像。“百度镜像”难道是百度镜像了你的网站?其实不是,在SEO术语中,是指你的网站被其他站点镜像了,百度收录了这个站点而已。文章源自MAY的SEO博客-https://may90.com/seo/baidu/mirroring.html
1. 百度镜像网站是什么?
百度镜像网站是指某一网站的的内容、目录层次与您的网站保持同步,包括内链、内容、图片等,你更新他也自动更新,对方站点内容与您的站点几乎是完全同步的,就像是照镜子一样。文章源自MAY的SEO博客-https://may90.com/seo/baidu/mirroring.html
2. 百度镜像网站的三种形式:
①. 内容镜像
镜像网站搭建了独立的网站,有自己的网站目录层级,它只是在某个目录或者某些目录镜像你网站的内容。
②. 主体镜像
整站框架和内容都会调用目标网站的内容,镜像网站除域名外的每个元素都相同。
③. 框架镜像
这种形式并非完全的百度镜像,它利用框架技术来实时镜像,并没有同步目标网站的内容,危害性不大。
3. 百度镜像网站与采集站有什么区别?
①. 镜像网站不抓取内容,不导入数据库,访问时实时从被镜像的站点调取内容,然后自动处理(替换URL、文字、加JS处理等),然后实时显示。被镜像的网站有更新,镜像网站实时显示。
②. 采集站是抓取目标网站的内容,导入到自己网站的数据库,然后通过程序调用到自己网站上。内容无法实时同步,采集调用以后才会出现。
4. 如何知道网站被百度镜像了?
将自己网站原创内容和页面meta标题放到百度进行搜索,真有出现title,description和自己网站内容一模一样的链接(除了网站域名),点击链接后直接跳转到那个网站,再详细查看是否有被镜像的痕迹。
5. 百度镜像网站如何解决?
网站被镜像后,网站流量、收录、关键词排名等都会受到一定程度的影响,但是彻底防止镜像没有那么容易,只能说增加镜像的难度:
①. 定位抓取网站的ip,直接封掉;
②. 在主题中使用php代码,禁止空referer和特殊UA的机器人或个人抓取
③. 图片都加上水印
④. 全站禁止复制粘贴
百度官方也给了一些解决方法,对于企业网站来说维权会更容易些,个人网站在没有任何资质的情况下维权会比较困难:
通过jubao.baidu.com进行投诉,如涉及仿冒官网等问题,请您在举报类型中选择“虚假欺诈-冒充官网”;如有的镜像站点会跳转到博彩站点的话,建议您在举报类型中选择“违法和不良信息举报-赌博博彩”……
百度镜像网站是我们很多站长和SEO优化人员深恶痛绝的现象,希望百度能加大对镜像网站的打击力度;同时也希望有些站长能老老实实做好自己的网站,不要去采集和镜像他人网站,共同维护搜索生态健康发展。
1F
确实比较恼火,有些人专门镜像别人的站点。。容易导致seo数据异常和波动。。。
B1
@ wordpress建站吧 确实,辛辛苦苦写的文章就被别人镜像走了
2F
全站禁止复制粘贴好像无法防止镜像网站吧?
B1
@ boke112联盟 是的,但能防一部分复制粘贴的人。我很多文章被别人一声不吭就转走了,还不带转载链接
3F
网站没有流量 一般不怕。一旦被盯上 不好防护。
B1
@ 商业百科网 现在感觉个人站长也特别难。那些一字不落全转走也太过分了,是不是?
4F
做好百度镜像处理吧!!!