[发明专利]基于上下文本体树计算用户偏好相似度的信息推荐方法在审
申请号: | 201710477707.5 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107391582A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 肖亮;郭飞鹏 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司33201 | 代理人: | 王兵,黄美娟 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 上下文 本体 计算 用户 偏好 相似 信息 推荐 方法 | ||
1.基于上下文本体树计算用户偏好相似度的信息推荐方法,包括以下步骤:
步骤1,基于上下文的用户偏好提取;
输入:网络用户ui,商品sj,上下文集合Ck;
输出:基于上下文的用户偏好
步骤11:计算单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据,其中dij为含有上下文的用户历史行为上下文的数目;用户出于某种目的在某个时刻购买的商品信息(Product)、购买时间(BTime)、购买的意图(Intention)组成的行为向量UHBC={Product,BTime,Intention},为多维度上下文组合;
步骤12:计算某种上下文类型Ccontext的影响程度εijk,用于度量上下文对用户行为Q的差异化认知,N为用户行为记录数;
步骤13:计算单维度上下文用户偏好;以单维度用户历史行为上下文为数据源,通过K-Means算法计算单维度上下文用户偏好其取值区间为[a,b];
步骤14:在某一上下文类型Ck影响下用户ui对商品sj的偏好的影响程度作用下,基于某一类上下文影响下的用户偏好来计算ui在组合上下文实例影响下对sj的偏好;
步骤2,基于本体表达的上下文相似度计算;上下文相似度算法利用上下文本体模型的树形结构从子节点到父节点再到根节点进行递归相似度运算,循环计算每层节点之间的概念属性相似度,最后对先前上下文层次模型与当前上下文层次模型的综合相似度进行对比;
输入:上下文本体树CT1和CT2;
输出:用户上下文相似度CTSim(G,G′);
步骤21:初始化CTSim(G,G′)=0;
假设当前上下文本体树CT1中某一个非叶子结点G,G={G1,G2,…GN}代表G的N个子节点,先前上下文本体树CT2中某一个非叶子结点G′,G′={G′1,G′2…G′N}代表G′的N个子节点,计算G与G′的相似度如下:
其中,∑wi=1,wi为第i个子结点的权重;
步骤22:判断CT1中的上下文概念Gi是否存在,如果存在则跳转到步骤23,否则结束;
步骤23:判断CT2中是否存在与Gi对应的Gi′,如果存在则跳转到步骤24,否则跳回步骤22;
步骤24:利用公式CTSim(G,G′)+=wi×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部Gi与Gi′的相似度,获取综合相似度;
采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念Gi与Gi′之间的相似度;
其中,ed(Gi,Gi′)为Gi与Gi′之间的Levenstein编辑距离;
通过在推荐过程前用上下文过滤能够提高每类中“用户-上下文”关联关系,从而提升推荐性能;利用上下文信息对“用户-项目”评分进行聚类,目的是将具有相似上下文的“用户-项目”聚在一类,以达到降低数据噪音的目的;
将上下文信息采用本体概念树的形式来描述,对上下文进行形式化定义与知识表达,在此基础上,构建基于本体的用户上下文层次结构模型;个性化推荐过程中影响用户网络行为的某一上下文因素集合Ck={基础,天气,位置,时间};
步骤3,基于用户上下文偏好分析的协同过滤推荐;
输入:上下文集合C、网络用户u、服务推荐集合Service(R)S,“用户—项目”评分矩阵,“项目—上下文”关联矩阵;
输出:TOP-N个推荐服务及评分;
步骤31:根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集,并得到用户u的所有偏好数据构造“上下文——项目”矩阵;
步骤32:调用上下文相似度计算方法计算(c)ij中上下文之间的相似度;
步骤33:构建新的“用户-上下文——项目”三维矩阵,提出一个改进的基于上下文相似度的用户相似度计算方法:
其中表示用户ui对全部相关上下文的平均偏好,相关上下文即通过项目关联起来的上下文,而非全部上下文;基于相似度sim(ui,uj)context-pearson可以为用户ui选择k个最近邻;
步骤34:寻找上下文ci影响下的目标用户ui的最近邻集合;由于用户偏好与上下文密切相关,因此,本发明首先根据步骤2获取上下文ci和cj之间的相似度;然后,分别寻找在上下文ci和cj影响下ui各自的最近邻居集;最后,将上下文cj下的最近邻居用户合并到上下文ci下的最近邻居集合中;
用Nj={Nj,c1,Nj,c2,...,Nj,ck},1≤j≤Num(U)表示该最近邻居集合;其中c1,c2,…,ck为k个上下文,Num(U)为用户总数,表示用户j在第ci个上下文影响下的相似用户集合;
步骤35:利用步骤34获取的k个最近邻居的用户偏好,通过以下公式预测潜在用户评分
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710477707.5/1.html,转载请声明来源钻瓜专利网。