在SEO领域,我们经常会谈论两个话题就是:重复页面?重复内容?这两个话题可以简单理解为同一个话题,就是网站上出现了重复,对网站有没有影响是我们最终所关心的。因此,解决重复页面或重复内容是根本!文章源自MAY的SEO博客-https://may90.com/share/repeatcontent.html
重复页面或内容如何分类?
站内重复:同一页面或内容有两个或两个以上的网址,这由站点管理员或web开发团队控制。文章源自MAY的SEO博客-https://may90.com/share/repeatcontent.html
站外重复:同一页面或内容在两个或两个以上的网站都出现,这往往是无法直接控制的。
为什么重复内容或重复页面有问题?
我们往往花费很长的时间去解释重复内容或重复页面怎么样不好?往往让人也是不知多云。May发现解释重复页面或重复内容为什么不好最好的方法是首先告诉您页面唯一或内容唯一为什么很好。
独一无二的内容是使自己与其他页面或其他网站区分开的最好方法。当您的网站上出现的内容都是新奇的观点,您就会脱颖而出。因为您有别人没有的东西;另一方面,当您用相同的内容来描述您的产品或服务或在其他站点上重新发布内容时,您将失去独特的优势。
站内重复:链接不唯一?
站内重复是您可以自己来控制的,通常是源于不良的网站结构或者不良的网站开发。一个强大的网站架构是一个网站的基础。如果当开发人员不遵循对搜索引擎友好规则时,造成内部竞争,您可能会失去宝贵的机会参与排名。
现在,让我们深入研究一些常见的站内重复问题和解决方案。太多的电子商务网站都会遇到一些常见的重复。
举例1. 假设您正在上门维修站点,并且正在寻找有关安装浴室地板的书籍。您可以通过以下任一导航路径找到所需的书:
首页>地板>浴室>书本
首页>浴室>书本>地板
首页>书籍>地板>浴室
这些都是可行的导航路径,但是当为每个路径生成唯一的URL时就会出现问题:
https://www.example.com/flooring/bathroom/books/fake-book-by-fake-author
https://www.example.com/bathroom/books/flooring/fake-book-by-fake-author
https://www.example.com/books/flooring/bathroom/fake-book-by-fake-author
我已经看到类似的网站为每个产品创建多达3个URL,从而将一个5k产品网站变成一个具有45k重复页面的网站。那这是个大问题。
不仅如此,搜索引擎还限制了其爬网带宽,将其用于索引独特且有价值的内容。当您的网站有很多重复的页面时,搜索引擎很有可能会停止抓取,甚至没有索引到您的唯一内容的一小部分。这意味着数百个有价值的页面将不会在搜索结果中显示,而被索引的页面是相互竞争的重复项。这是一件特别可悲的事情!
解决方案a:主URL分类
解决此问题的一种方法是仅将产品标记为一个类别,而不是多个。这就解决了重复问题,但对于购物者而言,不一定是最佳的解决方案,因为它消除了其他导航选项来查找他们想要的产品。
另一种选择是从URL完全删除任何类型的分类。这样,无论用于查找产品的导航路径如何,产品URL本身始终是相同的,并且可能看起来像这样:
https://www.example.com/products/fake-book-by-fake-author
这可以修复重复项,而不会更改访问者浏览产品的方式。这种方法的缺点是您会丢失URL中的类别关键字。这种做法并不有利于SEO优化。如果您想将解决方案提高到一个新的水平,并在保持用户体验的同时获得最大的优化价值,请构建一个选项,除其他产品外,还可以将每个产品分配到“主”类别。
这可能会使URL看起来像这样:
https://www.myfakesite.com/flooring/fake-book-by-fake-author 或
https://www.myfakesite.com/bathroom/fake-book-by-fake-author 或
https://www.myfakesite.com/books/fake-book-by-fake-author
尽管确实需要一些额外的编程,但后一种解决方案是最佳的整体解决方案。
解决方法b:canonical
由于无法对现成的CMS或电子商务解决方案始终选择主分类选项,因此有一个替代选项可以帮助解决重复内容的问题。这涉及防止搜索引擎索引所有非规范的URL。虽然这可以使重复的页面不包含在搜索索引中,但是它不能解决拆分页面权限的问题。发送到不可索引URL的任何链接值都将丢失。
解决方法是利用canonical标签。这类似于选择主类别,但通常几乎不需要任何其他编程。
您只需为每个产品添加一个字段,即可为您分配一个规范的URL,即“您想在搜索中显示的URL”。
规范标签如下所示:
<link rel ="canonical" href ="https://www.example.com/books/fake-book-by-fake-author">
尽管访问者使用的是URL,但每个重复的URL上的幕后规范标记都将指向单个URL。
从理论上讲,这告诉搜索引擎不要索引非规范的URL,也不要将所有其他价值指标分配给规范的版本。这在大多数情况下都有效,但实际上,搜索引擎仅将规范标记用作“信号”。然后,他们会选择视情况应用或忽略该标记。您可能会或可能不会将所有链接权限传递给正确的页面,并且可能会也可能不会将非规范页面排除在索引之外。我始终建议实施规范标签,但是由于它不可靠,因此在可以实施更正式的解决方案之前,请先将其视为一种“占位”的解决方案。
举例2. URL冗杂
最基本的网站体系结构问题之一是如何在浏览器中访问页面。
默认情况下,几乎可以使用稍微不同的URL访问站点的每个页面。如果未选中,则每个URL都将导致具有完全相同内容的完全相同页面。
仅考虑主页,可以使用四个不同的URL来访问它:
http://site.com
http://www.site.com
https://site.com
https://www.site.com
在处理内部页面时,您可以通过添加斜杠来获得每个URL的附加版本:
http://site.com/page
http://site.com/page/
http://www.site.com/page
http://www.site.com/page/
等等。
解决方案:301重定向和内部链接一致性
除了我在上面提到的规范标记之外,这里的解决方案是确保您具有所有替代版本的URL重定向到规范URL。请记住,这不仅是首页问题。同一问题适用于您的每个网站URL。因此,实施的重定向应该是全局的。确保强制每个重定向到规范版本。例如,如果规范URL为https://www.site.com,则每个重定向都应指向该URL。许多人都犯了错误,添加了如下所示的其他重定向:
Site.com> https://site.com> https://www.site.com
Site.com> www.site.com> https://www.site.com
而是,重定向应如下所示:
http://site.com> https://www.site.com/
http://www.site.com> https://www.site.com/
https://site.com> https://www.site.com/
https://www.site.com> https://www.site.com/
http://site.com/> https://www.site.com/
http://www.site.com/> https://www.site.com/
https://site.com/> https://www.site.com/
通过减少重定向转向次数,您可以加快页面加载速度,减少服务器带宽并减少一路上可能出现的错误。
站外重复又是怎么一回事?
您在自己的网站上重新发布的第三方内容。通常,这种方法是不可取的。
经您批准,您的内容已重新发布在第三方网站上。这通常是文章分发或反向文章分发的形式。
有人从您的网站上窃取的内容,未经您的许可而重新发布。这是内容采集和小偷的行为。
站外重复有一部分是我们自己可以控制的,也有一部分是我们自己无法控制的。其实不管是站内还是站外,重复的内容实际上都会产生竞争,每个版本都有可能不被搜索引擎收录或直接忽视。因此独特的内容被搜索引擎和用户发现的可能性才是最大。
评论