[发明专利]一种基于大数据的信息推荐系统有效

专利信息
申请号: 202011252127.4 申请日: 2020-11-11
公开(公告)号: CN112364243B 公开(公告)日: 2021-12-24
发明(设计)人: 王燕华;黄瑜丹 申请(专利权)人: 王燕华
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/958
代理公司: 北京麦汇智云知识产权代理有限公司 11754 代理人: 郭童瑜
地址: 362400 福建省*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 信息 推荐 系统
【权利要求书】:

1.一种基于大数据的信息推荐系统,其特征在于,包括数据采集模块、数据预处理模块、信息安全系统、数据挖掘分析模块、评估模块、数据存储模块、信息推荐模块,终端模块,云端模块,

所述数据采集模块依据每个用户对某些项目的打分构建用户-项目评分矩阵,设用户的集合U={u1,u2,u3,…,um},所有项目的集合C={c1,c2,c3,…,cn},m个用户n个项目构成的评分矩阵为Sm×n,在评分矩阵中,矩阵中的元素Sij是用户ui对项目c的评分;

采用所述数据挖掘分析模块计算目标用户与用户集合中的其他用户的相似度,具体步骤如下:

S1.为了简化,采用i,j代替ui,uj,通过计算两个用户向量之间的夹角的余弦来度量二者的近似相似度:

式中,Sic和Sjc分别表示用户ui和uj对项目c的评分,U表示所有用户集合,Sim'(i,j)是用户ui和用户uj之间的近似相似度;

S2.根据用户背景信息对相似度进行加权平衡,以弥补评分信息不足时最近邻选择面临的瓶颈问题,适用于衡量不同用户之间的特征信息偏差,计算公式如下:Sim(i,j)=β×Sim'(i,j)+(1-β)×Sim'(i,j);

其中,Sim(i,j)是用户ui和用户uj之间的修正相似度,β是调整因子,可根据不同情形下的用户需求进行自适应调整,β的动态调整公式为:

β=|Sic|/(|Sic|+|Sjc|);

S3.将Sim(i,j)相似性从大到小排序,生成最近相邻集的集NN={U1,U2,U3…Up};

S4.计算用户ui对用户uj的信任度TD(i,j)的公式如下:

AccTime(j,i,c)表示用户uj到用户ui的关于项目c推荐的正确度,ε是固定阈值,如果Si,c与Sj,c之间差值的绝对值小于或等于ε,则AccTime(j,i,c)等于1;如果Si,c与Sj,c之间差值的绝对值大于ε,则AccTime(j,i,c)等于0,RecTime(j,i)表示数据集中所有其他用户uj对用户ui关于所有项目推荐的总次数;

S5.计算并保存用户的信任信息,然后再用TD来基于信任和相似性设计混合推荐算法,基于信任度和相似度的权值合成如公式所示:

weight(i,j)=α·sim(i,j)+(1-α)·TD(i,j)+η·W(i)+(1-η)·TD(i,j);

式中,weight(i,j)表示权重,α、η是权重系数;

S6.通过所述评估模块将用户ui在项目c上的预测评分Pi,c表示为:

式中,表示用户ui对项目c的平均评分,表示用户uj对项目c的平均评分;

S7.如果两个用户之间的相似度较高,则这两个用户将对同一项目给出相似或相同的得分,将根据目标用户NN集中用户对该项目的得分计算加权平均值作为目标用户的预测得分,然后通过所述信息推荐模块将排名在前几位的物品推荐给用户。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王燕华,未经王燕华许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011252127.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top