[发明专利]一种个性化多维度的文档排序方法和系统在审
申请号: | 201210069568.X | 申请日: | 2012-03-06 |
公开(公告)号: | CN103309900A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 祁勇 | 申请(专利权)人: | 祁勇 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518053 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 多维 文档 排序 方法 系统 | ||
1.一种个性化多维度的文档排序方法,其特征在于,在服务器中设置领域特征集K={1,2,...,L},并且执行如下步骤:
获得多个文档,组成文档集D={1,2,...,M};所述文档集D中至少含有两个文档子集,其中文档集中的每个文档含有至少一个链接指向所述文档集D中的文档,文档集中的每个文档至少被所述文档集S中的一个文档所含有的链接指向;并且S∪E=D,S∩E≠Φ;
所述文档集D中的每个文档都设有排序向量和参数向量;设文档m(m∈D)的排序向量Kp(m)=[PR(m,1),PR(m,2),...,PR(m,k),...,PR(m,L)],其中所述PR(m,k)表示在特征k(k∈K)下所述文档m在所述文档集D中的排序值;设所述文档m的参数向量Kd(m)=(dwm1,dwm2,...,dwmk,...,dwmL),其中所述dwmk表示所述文档m与特征k(k∈K)的相关度;所述Kd(m)是由参数向量更新算法进行更新的;
更新所述文档集D中每个文档的排序向量;排序向量更新算法如下:所述文档集D中的任意一个文档m在特征k(k∈K)下的排序值,是所述文档集S中链接到所述文档m的每个文档在所述特征k下的排序值以及所述文档集S中链接到所述文档m的每个文档与所述特征k的相关度的函数;
根据所述排序向量,对所述文档集D中的文档进行处理。
2.根据权利要求1所述的方法,其特征在于,多次使用所述排序向量更新算法,对所述文档集D中每个文档的排序向量进行迭代更新。
3.根据权利要求1所述的方法,其特征在于,所述排序向量更新算法还包括以下步骤,即根据所述文档集S中每个文档的链出数,调整所述文档集S中的每个文档在每个特征k(k∈K)下的排序值。
4.根据权利要求1所述的方法,其特征在于,所述参数向量更新算法,包括如下步骤:首先,获得多个用户,组成用户集U={1,2,...,N},设用户j(j∈U)的参数向量Ku(j)=(uwj1,uwj2,...,uwjk,...,uwjL),其中所述uwjk表示所述用户j与特征k(k∈K)的相关度;然后,为所述文档集D中的部分文档设置参数向量初始值,以及为所述用户集U中的部分用户设置参数向量初始值;最后,多次执行以下步骤:
接收任意一个用户j(j∈U)访问任意一个文档i(i∈D)的信号,所述信号至少包括所述文档i和所述用户j的标识;
根据所述文档i的标识,读取所述文档i的参数向量Kd(i);
根据所述用户j的标识,读取所述用户j的参数向量Ku(j);
更新所述文档i和所述用户j的参数向量:
Kd*(i)=function1[Kd(i),Ku(j)]
Ku*(j)=function2[Kd(i),Ku(j)]
其中所述Kd(i)和所述Kd*(i)分别表示更新前和更新后所述文档i的参数向量,所述Ku(j)和所述Ku*(j)分别表示更新前和更新后所述用户j的参数向量。
5.根据权利要求4所述的方法,其特征在于,在所述参数向量更新算法中,满足Kd*(i)≥Kd(i)和Ku*(j)≥Ku(j)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于祁勇,未经祁勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210069568.X/1.html,转载请声明来源钻瓜专利网。