[发明专利]一种个性化多维度的文档排序方法和系统在审
申请号: | 201210069568.X | 申请日: | 2012-03-06 |
公开(公告)号: | CN103309900A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 祁勇 | 申请(专利权)人: | 祁勇 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518053 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种个性化多维度的文档排序方法和系统。所述方法首先根据文档之间的链接关系和文档的参数向量,迭代计算在每个特征下每个文档的排序值;然后根据查询用户提交的搜索条件获取一组文档,并根据所述一组文档中每个文档的排序向量和所述查询用户设置的查询向量,计算所述一组文档中每个文档的个性化排序值;最后根据所述个性化排序值的大小,将所述一组文档发送给所述查询用户。其中文档的参数向量是根据参数向量更新算法进行更新的。本发明还提出了一种个性化多维度的文档排序系统。本发明方法能够提高搜索引擎的查准率以及网页排名算法的反作弊能力。 | ||
搜索关键词: | 一种 个性化 多维 文档 排序 方法 系统 | ||
【主权项】:
1.一种个性化多维度的文档排序方法,其特征在于,在服务器中设置领域特征集K={1,2,...,L},并且执行如下步骤:获得多个文档,组成文档集D={1,2,...,M};所述文档集D中至少含有两个文档子集,其中文档集中的每个文档含有至少一个链接指向所述文档集D中的文档,文档集中的每个文档至少被所述文档集S中的一个文档所含有的链接指向;并且S∪E=D,S∩E≠Φ;所述文档集D中的每个文档都设有排序向量和参数向量;设文档m(m∈D)的排序向量Kp(m)=[PR(m,1),PR(m,2),...,PR(m,k),...,PR(m,L)],其中所述PR(m,k)表示在特征k(k∈K)下所述文档m在所述文档集D中的排序值;设所述文档m的参数向量Kd(m)=(dwm1,dwm2,...,dwmk,...,dwmL),其中所述dwmk表示所述文档m与特征k(k∈K)的相关度;所述Kd(m)是由参数向量更新算法进行更新的;更新所述文档集D中每个文档的排序向量;排序向量更新算法如下:所述文档集D中的任意一个文档m在特征k(k∈K)下的排序值,是所述文档集S中链接到所述文档m的每个文档在所述特征k下的排序值以及所述文档集S中链接到所述文档m的每个文档与所述特征k的相关度的函数;根据所述排序向量,对所述文档集D中的文档进行处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于祁勇,未经祁勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210069568.X/,转载请声明来源钻瓜专利网。