SEO友好的URL:URL优化没有想象中的简单

一个SEO友好的URL格式可以大大提升网站的爬取率以及索引率。此外,在URL这个地方部署关键词可以提升网页的相关性。同时,简洁的URL也能在谷歌搜索结果中呈现出有助于读者理解网站结构的面包屑导航。

SEO友好的URL是怎么样的?相信很多懂SEO的人都能说个大概。今天这篇文章主要讲述一般的URL优化方法,以及深入讨论一种经常看似SEO友好,实际会造成SEO负面影响的URL形式。

URL优化:SEO友好的URL格式是怎么样的?

1. 尽可能使用静态的URL。

静态URL通常不包含任何url参数。而动态的URL一般是包含一个问号(?)后面紧跟一个参数的URL。参数可以是会话ID、排序参数、或者目录代码、以及字母和数字相结合的  一长串无意义的字符。

普遍认为静态或伪静态的URL对于索引和排名具有优势。这是基于这样的假设,即搜索引擎在爬取和分析包含会话ID或源跟踪器的URL时会遇到问题。但是,事实上,Google在这两个方面都取得了一些进展。虽然静态URL可能在点阅率方面略有优势,因为用户可以轻松地读取URL,但是对于那些使用数据库驱动的网站(即动态网站)并不意味着在索引和排名方面存在明显的劣势。针对这些动态的网站可以通过隐藏参数的方法做成伪静态的URL。如Wordpress后台就能直接选择伪静态的URL格式。

2. 使用具有文本意义的URL格式。

要使用文本(英文单词或字母)且能被用户轻易理解的,不要使用长串数字(包括日期、会话ID、排序参数等)。简单易懂的包含语义的URL可以帮助谷歌的爬虫理解URL的意思,以及通过URL推测出网页大概的主题。

3. 使用连字符分词

谷歌建议在URL中使用连字符(-)而不是下划线(_),因为下划线或其他符号可能会被谷歌认为是一个整体,并不能起到分词的作用,因此搜索引擎不能通过URL逐个单词去理解您的网页的大概内容。

4. URL尽可能保持简短

过于复杂的URL(尤其是包含多个参数的URL)可能会造成大量的不必要的URL变体,这些URL变体指向您网站上的相同或相似内容。进而,谷歌的爬虫(Googlebot)可能会消耗比所需更多的带宽,或者可能无法完全索引您网站上的所有内容。

5. 在URL中部署关键词

在URL中部署关键词,可以很好地增强当前页面的关键词的相关性。我们都知道相关性是谷歌的排名因素之一。

 

 URL SEO的误区:如何避免使用会造成大量重复内容的URL

这一点是今天我们要着重讲解的内容。也是是经常被忽略的,因为有些URL看起来是静态的并符合以上五点规则,实际并不能起到提升爬取以及索引率的作用。为什么呢?我们还是通过一个案例来一一讲解吧。

这种情况一般会发生在企业,并且这个企业的网站使用的是带数据库的动态网站(也就是说不是通过纯HTML语言编写的网站),当SEO 专员提出要把带参数ID的URL优化成带英文单词以及连字符的URL。技术部门认为映射的方式(通过映射的方式可以把每个ID映射到一个独立的URL)技术难度大,于是就以把文章标题插入在URL并用连字符连接起来,同时保留原来URL的一长串参数。

如最初URL为:

https://XXXdomain.com/en/community/details/topicId_149614/

考虑到隐藏ID的技术成本比较高,后台必须通过ID来匹配内容,又要迎合SEO的需求,最终改成的URL结构为:

https://XXXdomain.com/en/community/details/-Monthly-Feature-Feast-February-2021-Mention-Your-Friends/topicId_149614/

这样看起来是不是好像挺符合要求的?其实并不是!

因为这只是障眼法,可以随意修改/topicId_149614/前面的内容,也就是说你把前面的Monthly-Feature-Feast-February-2021-Mention-Your-Friends修改任意一个字符都可以打开同一个页面,这样的URL结构会造成大量的重复页面。

如把URL上的2021去掉可以正常打开页面:

打开的是和原始URL一样的页面:

改变URL字段后,打开源码后发现规范化网址(Canonical Link)也会同步改变。因为这样的URL存在太多变体会导致太多重复内容的页面,而这些页面也无法从CMS中逐一找到给它们指定一个规范化网址(Canonical Link)。因此,这些重复页面无法通过规范化网址(Canonical Link)避免重复索引。我们知道,若网站中存在大量重复网页,且并未通过规范化网址(Canonical Link)指定一个优先索引的网页,这会导致谷歌不索引所有这些重复的网页。

把这个原始URL通过谷歌site指令验证,果然内容上线后一两个月了还没被谷歌成功索引:

no-index

 

综上,优化URL结构的时候一定要做到位,避免适得其反!