[发明专利]一种用于理财产品推荐系统的集成方法有效
申请号: | 201810484714.2 | 申请日: | 2018-05-20 |
公开(公告)号: | CN108665323B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 李建强;李倩;张丝雨 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06Q40/06 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种用于理财产品推荐系统的集成方法,基于数据平滑的协同过滤算法可以对稀疏数据进行填充,减少数据的稀疏性问题。基于人口统计学的推荐算法不需要历史数据,也不依赖物品的属性,可以解决用户的冷启动问题;将两种算法与表现性能良好的基于项目聚类和矩阵分解的推荐算法进行集成,扩大推荐算法的使用场景,提高推荐算法的自适应性。本发明集成方法可以有效地减少数据的稀疏性和解决冷启动问题,提升对每一位用户的推荐性能。 | ||
搜索关键词: | 一种 用于 理财产品 推荐 系统 集成 方法 | ||
【主权项】:
1.一种用于理财产品推荐系统的集成方法,其特征在于,包括以下步骤:步骤一:基于人口统计学的推荐算法。选取年龄、性别、职业和爱好4种特征,将各属性信息预处理成数字型表示法的形式,计算用户之间的相似度得到用户偏好和得到预测偏好矩阵;步骤二:基于项目聚类和矩阵分解的推荐算法步骤2.1、计算物品间的相似度通过采用曼哈顿距离来计算物品之间的距离。
其中,rui表示用户u对物品i的喜爱程度,dij表示物品i与物品j之间的距离,物品i与物品j之间的相似度表示为式(9)。
其中,ci表示物品i的流行度,cj表示物品j的流行度。物品的流行度就是点击该物品的人数,然后将物品进行分类,得到不同的聚类中心{c1,c2,…,ck},k为聚类的数目。步骤2.2、构建物品向量基于k个聚类中心,K设置为200,物品向量被定义为
其中,
将物品向量归一化:
最后,物品i的向量为:pi=(pi1,pi2,…,pik,…,piK) (13)其中,
步骤2.3、计算预测偏好矩阵基于物品向量和奇异值分解(SVD),可以得到预测偏好矩阵:
其中,n是物品的数量,m是用户的数量,
表示预测偏好,定义为:
其中,allMean是偏好的平均值,bu表示用户和allMean之间的偏差,bi表示物品和allMean之间的偏差,qu是用户u的向量,由随机值初始化;步骤三:基于数据平滑的协同过滤算法步骤3.1、计算用户的相似度采用皮尔逊相关系数来计算相似度,用户u和用户u’之间的相似度为:
其中,Ru(t)表示用户u对物品t的偏好,
表示用户u对所有物品的平均偏好,Ru,(t)表示用户u,对物品t的偏好,
表示用户u,对所有物品的平均偏好,t是用户u和用户u,都点击过的物品,用户定义为U={u1,u2,…,un},将用户划分成n个聚类,表示为
步骤3.2、基于上一步,平滑了用户尚未点击的数据集用户的偏好表示为:
其中,rui是由函数计算得出,
是对于用户u没有点击过的i由平滑得出,对于用户u,u属于的聚类表示为
考虑到个体差异,通过式(19)来计算![]()
![]()
是所有用户对物品i的平均偏好,按如下公式计算:
其中,Cu(i)∈Cu表示在聚类Cu中的点击过物品i的用户集,|Cu(i)|表示在聚类Cu中的点击过物品i的用户数量,可以通过计算加权和得到预测偏好:
其中,
是用户u对物品i的偏好,
是物品i的平均偏好,
是物品j的平均偏好,wuj是u和j之间的权重,sim(i,j)是i和j的相似度。步骤3.3、得到预测偏好矩阵
n是物品的数量,m是用户的数量。步骤四:对算法进行集成根据步骤一、二和三,得到了用户对每个产品的预测偏好,基于这些偏好,进行算法集成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810484714.2/,转载请声明来源钻瓜专利网。