[发明专利]基于上下文本体树计算用户偏好相似度的信息推荐方法在审
申请号: | 201710477707.5 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107391582A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 肖亮;郭飞鹏 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司33201 | 代理人: | 王兵,黄美娟 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于上下文本体树计算用户偏好相似度的信息推荐方法。该方法分析各种上下文类型及其具体实例对用户偏好的差异化影响,设计一种基于上下文的用户偏好提取方法;然后,利用本体对上下文进行语义表达,并构建基于本体树表达的上下文相似度计算方法,提升协同过滤推荐中寻找相似用户集的精确性;在上述用户偏好提取的基础上,将提取出的上下文引入到协同过滤推荐过程,计算上下文用户偏好之间的相似度,并设计一种基于用户上下文偏好分析的协同过滤推荐方法,解决了已有推荐方法的稀疏性、冷启动等问题。 | ||
搜索关键词: | 基于 上下文 本体 计算 用户 偏好 相似 信息 推荐 方法 | ||
【主权项】:
基于上下文本体树计算用户偏好相似度的信息推荐方法,包括以下步骤:步骤1,基于上下文的用户偏好提取;输入:网络用户ui,商品sj,上下文集合Ck;输出:基于上下文的用户偏好步骤11:计算单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据,其中dij为含有上下文的用户历史行为上下文的数目;用户出于某种目的在某个时刻购买的商品信息(Product)、购买时间(BTime)、购买的意图(Intention)组成的行为向量UHBC={Product,BTime,Intention},为多维度上下文组合;uhbcijkq=1dijΣr=1dijuhbcijr‾|Cr‾=c1...ck-1ckqck+1...cN;---(1)]]>步骤12:计算某种上下文类型Ccontext的影响程度εijk,用于度量上下文对用户行为Q的差异化认知,N为用户行为记录数;e(Ccontext⇒NQ)=p(Q|Ccontext)-p(Q|Ccontext‾)p(Q|C‾)[1-p(Q|C‾)]N;---(2)]]>步骤13:计算单维度上下文用户偏好;以单维度用户历史行为上下文为数据源,通过K‑Means算法计算单维度上下文用户偏好其取值区间为[a,b];(uic)ijkq=fKMeans(uhbcijkq1≤j≤M1≤k≤N′1≤q≤Zk)|uhbcijkq≠0;---(3)]]>步骤14:在某一上下文类型Ck影响下用户ui对商品sj的偏好的影响程度作用下,基于某一类上下文影响下的用户偏好来计算ui在组合上下文实例影响下对sj的偏好;(UIC)ijt′‾=Σk=1N′(ϵijk×(uic)ijkq);---(4)]]>步骤2,基于本体表达的上下文相似度计算;上下文相似度算法利用上下文本体模型的树形结构从子节点到父节点再到根节点进行递归相似度运算,循环计算每层节点之间的概念属性相似度,最后对先前上下文层次模型与当前上下文层次模型的综合相似度进行对比;输入:上下文本体树CT1和CT2;输出:用户上下文相似度CTSim(G,G′);步骤21:初始化CTSim(G,G′)=0;假设当前上下文本体树CT1中某一个非叶子结点G,G={G1,G2,…GN}代表G的N个子节点,先前上下文本体树CT2中某一个非叶子结点G′,G′={G′1,G′2…G′N}代表G′的N个子节点,计算G与G′的相似度如下:CTSim(G,G′)=Σi=1Nwi×Sim(G,G′)---(5)]]>其中,∑wi=1,wi为第i个子结点的权重;步骤22:判断CT1中的上下文概念Gi是否存在,如果存在则跳转到步骤3,否则结束;步骤23:判断CT2中是否存在与Gi对应的Gi′,如果存在则跳转到步骤4,否则跳回步骤2;步骤24:利用公式CTSim(G,G′)+=wi×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部Gi与Gi′的相似度,获取综合相似度;采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念Gi与Gi′之间的相似度;Sim(G,G′)=max(0,min(|Gi|,|Gi,|-ed(Gi,Gi,))min(|Gi|,|Gi,|)---(6)]]>其中,ed(Gi,Gi')为Gi与Gi′之间的Levenstein编辑距离;通过在推荐过程前用上下文过滤能够提高每类中“用户—上下文”关联关系,从而提升推荐性能;利用上下文信息对“用户—项目”评分进行聚类,目的是将具有相似上下文的“用户—项目”聚在一类,以达到降低数据噪音的目的;将上下文信息采用本体概念树的形式来描述,对上下文进行形式化定义与知识表达,在此基础上,构建基于本体的用户上下文层次结构模型;个性化推荐过程中影响用户网络行为的某一上下文因素集合Ck={基础,天气,位置,时间},假设基础,天气,时间,位置4个上下文每个因素具体实例个人均为3,且C1={男,晴天,家里,晚上}和C2={女,下雨,单位,上午}被视为两组不同的上下文信息,由此可得出该上下文模型含有81组不同的上下文信息;步骤3,基于用户上下文偏好分析的协同过滤推荐;输入:上下文集合C、网络用户u、服务推荐集合Service(R)S,“用户—项目”评分矩阵,“项目—上下文”关联矩阵;输出:TOP‑N个推荐服务及评分;步骤31:根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集,并得到用户u的所有偏好数据构造“上下文——项目”矩阵;步骤32:调用上下文相似度计算方法计算(C)ij中上下文之间的相似度;步骤33:构建新的“用户—上下文——项目”三维矩阵,提出一个改进的基于上下文相似度的用户相似度计算方法:sim(ui,uj)context-pearson=Σs′∈S′(rui,s′-ruis′‾)(ruj,s′-rujs′‾)Σs′∈S′(rui,s′-r‾ui)2Σs′∈S′(ruj,s′-r‾uj)2---(7)]]>其中表示用户ui对全部相关上下文(即通过项目关联起来的上下文,而非全部上下文)的平均偏好;基于相似度sim(ui,uj)context‑pearson可以为用户ui选择k个最近邻;步骤34:寻找上下文ci影响下的目标用户ui的最近邻集合;由于用户偏好与上下文密切相关,因此,本发明首先根据步骤2获取上下文ci和cj之间的相似度;然后,分别寻找在上下文ci和cj影响下ui各自的最近邻居集;最后,将上下文cj下的最近邻居用户合并到上下文ci下的最近邻居集合中;用Nj={Nj,c1,Nj,c2,…,Nj,ck},1≤j≤Num(U)表示该最近邻居集合;其中c1,c2,…,ck为k个上下文,Num(U)为用户总数,表示用户j在第ci个上下文影响下的相似用户集合;步骤35:利用步骤4获取的k个最近邻居的用户偏好,通过以下公式4‑8为预测潜在用户评分ru,s′context-CF=ruis′‾+Σuj∈Usim(ui,uj)context-pearson×(ruj,s′-rujs′‾)Σuj∈U|sim(ui,uj)context-pearson|---(8).]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710477707.5/,转载请声明来源钻瓜专利网。