[发明专利]一种用户兴趣模型的建立方法及系统有效
申请号: | 201110206861.1 | 申请日: | 2011-07-22 |
公开(公告)号: | CN102890689A | 公开(公告)日: | 2013-01-23 |
发明(设计)人: | 李楠 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 兴趣 模型 建立 方法 系统 | ||
1.一种用户兴趣模型的建立方法,其特征在于,该方法包括:
A、根据用户历史行为建立用户的用户兴趣模型,所述用户兴趣模型至少包括:用户兴趣词Term以及各Term的权值;
B、根据具体应用的用户历史行为,建立所述应用对应的Term知识集合,所述Term知识集合包括所述应用对应的Term;
C、用所述应用对应的Term知识集合对所述用户兴趣模型进行特征调整,得到所述用户在所述应用对应的用户兴趣模型。
2.根据权利要求1所述的方法,其特征在于,步骤A具体包括:
A1、获取用户历史行为的文本信息;
A2、对用户历史行为的文本信息进行分词;
A3、从分词结果中提取表达用户兴趣的Term及Term之间的共现关系,并为Term赋予权值以及为Term之间的共现关系赋予权值,形成所述用户的用户兴趣模型。
3.根据权利要求2所述的方法,其特征在于,根据Term的词频或者Term的词频-倒文档率为Term赋予权值,并根据Term之间共同出现的次数为Term之间的共现关系赋予权值。
4.根据权利要求1或2或3所述的方法,其特征在于,根据所述用户的兴趣时效性变化,对所述Term的权值进行动态调整;
所述动态调整采取以下策略中的至少一种:
为用户短时或短期网络行为对应的Term的权值设置上限值;
将用户爆发性网络行为对应的Term的权值按照时间进行衰减。
5.根据权利要求4所述的方法,其特征在于,所述为用户短时或短期网络行为对应的Term的权值设置上限值具体是:
当短时或短期内用户的网络行为出现重复,且使得这段时间内重复行为对应的各个Term的权值总和超过预设的上限值时,则将预设的上限值作为所述各个Term的权值总和,按分配前所述各个Term的权值大小为比例,分配到所述各个Term的权值中。
6.根据权利要求4所述的方法,其特征在于,将用户爆发性网络行为对应的Term的权值按照时间进行衰减具体为:
将在设定时间段内出现次数相比较在其他时间段内的出现次数高于预设程度的Term的权值按照预设的衰减策略进行衰减,所述预设的衰减策略为:线性衰减或者指数衰减。
7.根据权利要求2或3所述的方法,其特征在于,根据所述用户的兴趣时效性变化,对所述Term的权值进行动态调整,所述动态调整的策略是:增加用户重复性网络行为对应的Term的权值。
8.根据权利要求7所述的方法,其特征在于,所述用户重复性网络行为的识别条件包括:
用户兴趣模型中Term之间的共现关系重复出现,且重复出现的Term之间的共现关系的出现时间间隔超过预设的保护时间间隔。
9.根据权利要求3所述的方法,其特征在于,所述Term知识集合还包括:所述应用对应的Term的权值;
如果在所述用户兴趣模型中基于Term的词频为Term赋予权值,则在所述Term知识集合中基于Term的词频-倒文档率为Term赋予权值;或者,
如果在所述用户兴趣模型中基于词频-倒文档率为Term赋予权值,则在所述Term知识集合中基于Term的词频为Term赋予权值。
10.根据权利要求1所述的方法,其特征在于,所述Term知识集合还包括:所述应用对应的Term的权值;
所述步骤C具体包括:
将所述Term知识集合中不包含的Term从所述用户兴趣模型中过滤掉,且将所述Term知识集合中Term的权值与所述用户兴趣模型中同一Term的权值相乘,得到所述用户在所述应用对应的用户兴趣模型。
11.根据权利要求10所述的方法,其特征在于,所述步骤C还包括:
从所述用户在所述应用对应的用户兴趣模型中按照Term的权值提取满足预设条件的Term并保留提取的Term存在的共现关系,得到所述用户在所述应用对应的最终用户兴趣模型;
所述预设条件包括:权值排在前N个,N为预设的正整数,或者,权值大于预设的权值阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110206861.1/1.html,转载请声明来源钻瓜专利网。