济南网站优化_济南SEO_金桂SEO

找回密码
立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 754|回复: 0

PR算法介绍

[复制链接]

882

主题

882

帖子

2933

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2933
发表于 2015-8-26 22:15:59 | 显示全部楼层 |阅读模式
马上注册,结交更多好友,享用更多功能,让您轻松玩转济南网站优化
您还没有账号?立即注册。已有账号?点击登录。您也可以直接QQ登录
  PageRank

  基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T)/C(T)

  其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。

  PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn))

  A代表页面A

  PR(A)则代表页面A的PR值

  d为阻尼指数。通常认为d=0.85

  t1…tn 代表链接向页面A的页面t1到tn

  C代表页面上的外链接数目。C(t1)即为页面t1上的外链接数目

  从计算公式可以看到,计算PR值必须使用迭代计算才能得到。

  优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。

  不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。

  Topic-Sensitive

  (主题敏感的PageRank)

  基本思想:针对PageRank对主题的忽略而提出。核心思想:通过离线计算出一个PageRank向量集合,该集合中的每一个向量与某一主题相关,即计算某个页面关于不同主题的得分。主要分为两个阶段:主题相关的PageRank向量集合的计算和在线查询时主题的确定。

  优点:根据用户的查询请求和相关上下文判断用户查询相关的主题(用户的兴趣)返回查询结果准确性高。

  不足:没有利用主题的相关性来提高链接得分的准确性。

  Hilltop

  基本思想:与PageRank的不同之处:仅考虑专家页面的链接。主要包括两个步骤:专家页面搜索和目标页面排序。  优点:相关性强,结果准确。  不足:专家页面的搜索和确定对算法起关键作用,专家页面的质量决定了算法的准确性,而专家页面的质量和公平性难以保证;忽略了大量非专家页面的影响,不能反映整个Internet的民意;当没有足够的专家页面存在时,返回空,所以Hilltop适合对于查询排序进行求精。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

网站地图| 济南网站优化_济南SEO_金桂SEO  

Copyright © 2001-2013 Comsenz Inc.   All Rights Reserved.

Powered by Discuz! X3.2( 津ICP备14004013号-1 )

快速回复 返回顶部 返回列表