[发明专利]一种获取用户和文档个性化特征的方法和系统在审
申请号: | 201210581899.1 | 申请日: | 2012-12-17 |
公开(公告)号: | CN103870521A | 公开(公告)日: | 2014-06-18 |
发明(设计)人: | 祁勇 | 申请(专利权)人: | 祁勇 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518053 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种获取用户和文档个性化特征的方法和系统。所述方法通过用户访问文档的信号,来自动地更新用户和文档的个性化特征。用户的个性化特征依据用户访问过的文档的个性化特征进行更新,文档的个性化特征依据访问过该文档的用户的个性化特征进行更新。该方法解决了用户和文档个性化特征的大范围自动获取和实时更新等问题。根据获取的用户和文档的个性化特征,可在搜索引擎中实现个性化的文档排序以及在社交网络中实现个性化的信息过滤和筛选,进而提高搜索引擎的查准率和社交网络的信息检索效率。本发明还提出了一种获取用户和文档个性化特征的系统。另外本发明方法还能够提高网页排序算法的反作弊能力。 | ||
搜索关键词: | 一种 获取 用户 文档 个性化 特征 方法 系统 | ||
【主权项】:
1.一种获取用户和文档个性化特征的方法,其特征在于,所述方法包括在接入互联网的服务器中执行如下步骤:S11.获取并存储由多个用户标识组成的用户集U,由多个文档标识组成的文档集D,以及由多个特征标识组成的特征集K;S12.为所述用户集U中的至少一个用户设置参数向量初始值,或者为所述文档集D中的至少一个文档设置参数向量初始值,未设置参数向量初始值的用户和文档,其参数向量初始值缺省设为零向量;S13.接收任意一个用户m(m∈U)访问任意一个文档n(n∈D)的信号;S14.根据所述信号,读取所述用户m的参数向量(uwm1,uwm2,...,uwmk,...,uwmL),其中所述uwmk表示所述用户m与特征k(k∈K)的相关度;S15.根据所述信号,读取所述文档n的参数向量(dwn1,dwn2,...,dwnk,...,dwnL),其中所述dwnk表示所述文档n与特征k(k∈K)的相关度;S16.应用参数向量更新算法,更新所述用户m和所述文档n的参数向量,设更新后所述用户m的参数向量为(uwm1*,uwm2*,...,uwmk*,...,uwmL*),更新后所述文档n的参数向量为(dwn1*,dwn2*,...,dwnk*,...,dwnL*),则所述算法包括:uwmk*=g1(uwmk)+λ1(n,m,k,T)·f1(dwnk)(对于每个
)dwnk*=g2(dwnk)+λ2(m,n,k,T)·f2(uwmk)(对于每个
)返回所述步骤S13;其中,所述λ1(n,m,k,T)为在所述信号的类型T和所述特征k下所述文档n对所述用户m的影响系数,λ1(n,m,k,T)≥0,所述λ2(m,n,k,T)为在所述信号的类型T和所述特征k下所述用户m对所述文档n的影响系数,λ2(m,n,k,T)≥0,f1(x)、f2(x)、g1(x)和g2(x)都是非负增函数,且g1(x)≥x,g2(x)≥x,所述UKm是由所述用户m的参数向量(uwm1,uwm2,...,uwmk,...,uwmL)中数值最大的Pm个分量所对应的特征组成的集合,所述DKn是由所述文档n的参数向量(dwn1,dwn2,...,dwnk,...,dwnL)中数值最大的Qn个分量所对应的特征组成的集合,所述Pm和所述Qn为预设常数,若
则默认uwmk*=uwmk,若
则默认dwnk*=dwnk。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于祁勇,未经祁勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210581899.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种电絮凝水处理装置及电絮凝水处理方法
- 下一篇:槽绝缘防窜装置