PageRank和HillTop算法
PageRank
PageRank的原理类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。其原理参考了文献计量学的标准。Pagerank是一个用以衡量链接的数量和链接的质量的体系,其算法可以以下面的公式来简单介绍。实际的计算方法要复杂得多。
其中:系数为一个大于0,小于1的数。一般设置为0.85。网页1、网页2至网页N表示所有链接指向A的网页。
HillTop算法
HillTop算法的指导思想和PageRank的是一致的,都是通过网页被链接的数量和质量来确定搜索结果的排序权重。但HillTop认为只计算来自具有相同主题的相关文档链接对于搜索者的价值会更大:即主题相关网页之间的链接对于权重计算的贡献比主题不相关的链接价值要更高。如果网站是介绍“服装”的,有10个链接都是从“服装”相关的网站链接过来,那这10个链接比另外10个从“电器”相关网站链接过来的贡献要大。Bharat称这种对主题有影响的文档为“专家”文档,从这些专家文档页面到目标文档的链接决定了被链接网页“权重得分”的主要部分。
与PageRank结合HillTop算法确定网页与搜索关键词的匹配程度的基本排序过程取代了过份依靠PageRank的值去寻找那些权威页面的方法。这对于两个具有同样主题而且PR相近的网页排序过程中,HillTop算法就显得非常的重要了。HillTop同时也避免了许多想通过增加许多无效链接来提高网页PageRank值的做弊方法
CopyRight © 合肥SEO 2008包河区徽州大道银杏大厦1单元1002室 电话:86-0551-3429170 3414261
关于我们| 网站地图 | 联系方式
皖ICP备08104759号