在网站优化中,常常提到的“内容为王,链接为皇”现在已经不止是这么两点了,另外还有用户体验综合因素在内,内容为王,链接为皇,加上用户体验其实 就是三代搜索引擎的各自看重点,其中链接分析也算是运用得最火的技术,在很多黑帽SEO中也有许多技巧都是根据链接分析的漏洞来放大利用。今天成都SEO 就来总结一下搜索引擎链接分析的算法。
搜索引擎链接分析中最重要的两个算法要属于PageRank和HITS算法了,两个分别是从随机游走模型和子集传播模型两大模型来计算链接权重的传递方式。
先 来看看PageRank算法,PageRank算法是随机游走模型发展来的,PageRank主要是考虑入链数量和网页质量两个因素来判断一个网页的重要 性。但是由于PageRank没有考虑到主题相关性的问题,然后就延伸出了主题敏感PageRank算法,也叫作Topic Sensitive PageRank,加强了主题相关性链接的权重值。同时又有人研究出了智能游走模型和偏置游走模型两个链接算法,这两个算法弥补了PageRank的随机 式,因为在正常人浏览网页时不可能是随机点击页面上的链接,而是相关性的链接获得点击的可能性更大。
然后是子集传播模型下的延伸:HITS 算法。HITS算法定义了两个页面,分别是Hub页面和Authority页面,Hub页面指包含很多高质量Authority页面链接的页面,比如 hao123就是这类页面;Authority页面是某个领域和话题相关的高质量页面,类似于SEO领域的SEOWHY,搜索引擎里的百 度,Google。HITS就是相互扶持,一个好的Hub页面必定指向很多好的Authority页面,一个好的Authority页面必定有很多好的 Hub页面指向。
HITS算法的问题还是比较明显的,比如很容易被恶意利用,结构不稳定,计算效率低等原因,后来也就引申出了PHITS算法,这里就不再多做说明了。
鉴于PageRank算法和HITS算法的优缺点,又研究出了SALSA算法,主要利用了HITS算法的相关性特点,同时利用了PageRank算法的随机游走模型,也是目前链接分析算法效果最好的算法之一了。