[发明专利]一种数字信息推荐预测模型的训练方法和系统有效
申请号: | 201110339736.8 | 申请日: | 2011-11-01 |
公开(公告)号: | CN102508894A | 公开(公告)日: | 2012-06-20 |
发明(设计)人: | 鲁凯;王斌;史亮;李文娜;李锐;徐飞 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字 信息 推荐 预测 模型 训练 方法 系统 | ||
技术领域
本发明涉及数字信息处理领域,具体地,涉及数字信息推荐领域。
背景技术
随着互联网的快速发展,用户在各个门户网站、电子商务网站、视频或者音乐视听网站都面临信息过载的问题,因此挖掘用户的可能喜好,提供个性化的服务对提高用户的满意度和忠诚度具有非常重大的意义。推荐系统正是在这个背景产生的,并且近二十年来得到了非常迅猛的发展。IT巨头如亚马逊,谷歌,雅虎等,国内如当当网,淘宝网等都在其不同的应用中提供了个性化的推荐系统,极大的方便了用户并且也给商家带来了巨大的利益。
推荐系统大致可以分为两类:基于内容的推荐系统及基于协同过滤的推荐系统。基于内容的推荐系统主要是利用项目(item)的内容信息,例如项目名字等文字信息来找出相似的项目集合,然后根据用户喜欢的项目推荐该项目的相似项目。基于协同过滤的推荐系统主要是利用用户对项目的反馈,例如用户对项目的打分记录,购买记录,浏览记录等挖掘用户的可能喜好,推荐其可能喜欢的项目集合。
因为基于内容的推荐系统只与当前用户选择的项目有关,该方法没有考虑到对用户的历史行为进行建模,因此该方法无法满足用户的个性化需求。
对于基于协同过滤的推荐系统,其推荐过程主要包括下列步骤:第一步获得用户对各个音乐的打分情况,然后对打分数据进行预处理;第二步是使用相关协同过滤的相关算法对打分数据进行建模,预测,这个过程是离线完成的;第三步是对于每个活跃用户,将预测完的该用户对各个音乐的可能打分值取最高的前K个(Top-K)项目进行在线推荐。图1示出了上述推荐过程的流程图。这类系统不需要考虑项目的属性以及领域知识即可获得很好的推荐效果,因此大多数推荐系统都是基于协同过滤技术的。然而由于在实际中用户的打分数往往比较少,所以协同过滤技术在应用时面临很多问题,例如冷启动问题,数据稀疏问题等。其中数据稀疏性对产生精确推荐往往造成很大的影响。
上述推荐系统均为考虑到用户打分随时间变化而呈现的规律性变化,从而未能准确地为用户进行期望信息的推荐。
发明内容
本发明的目的在于提供一种推荐效果更理想的数字信息推荐预测模型的训练方法及系统。
根据本发明的一个方面,提供了一种数字信息推荐预测模型的训练方法,包括:
1)接收打分数据;
2)建立模型并利用所述打分数据训练所述模型,其中所述模型中包括打分时间段对用户的影响参数。
上述方法中,所述模型还包括:打分时间段对用户偏差的影响参数。
上述方法中,所述模型还包括:(ruj-buj)的补偿参数,
其中ruj表示已知的用户u对项目j打分的打分值,buj表示用户u对项目j打分的打分值相对于平均打分值的偏差,其中项目表示数字信息的类别的具体内容。
上述方法中,所述(ruj-buj)的补偿参数的系数为(|(Rk(i;u)|+1)-1/2,
其中Rk(i;u)=R(u)∩Sk(i),其中R(u)是用户打分值已知的项目集合,Sk(i)表示与项目i最相似的k个项目的集合。
上述方法中,所述模型还包括:隐式反馈。
上述方法中,所述隐式反馈的系数为(|Nk(i;u)|+1)-1/2,
其中Nk(i;u)=N(u)∩Sk(i),其中N(u)是用户打过分的项目集合,Sk(i)表示与项目i最相似的k个项目的集合。
上述方法中,所述Sk(i)是基于打分的项目相似集合、基于所述类别之间存在的关联关系的项目相似集合和基于内容的项目相似集合中的任意一个或任意二或三个的融合结果。
上述方法中,所述步骤2)中所述建立模型是基于隐参数模型建立。
上述方法中,所述步骤2)的所述训练是基于最小化损失函数来训练。
上述方法中,所述最小化损失函数的求解是采用梯度下降法。
根据本发明另一方面,还提供了一种数字信息推荐预测模型的训练系统,包括:
接收模块,用于接收打分数据;
建模模块,用于建立模型并利用所述打分数据训练所述模型,其中所述模型中包括打分时间段对用户的影响参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110339736.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆制动灯状态监测系统
- 下一篇:用于梳理机上的双出条装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置