[发明专利]一种基于异构信息网络的电影推荐方法有效

专利信息
申请号: 201611248620.2 申请日: 2016-12-29
公开(公告)号: CN106709037B 公开(公告)日: 2019-11-08
发明(设计)人: 余啸;刘进;殷晓飞;崔晓晖;杨威;井溢洋 申请(专利权)人: 武汉大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9536;G06F16/2458
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 鲁力
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于异构信息网络的电影推荐方法,包括链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户‑电影异构网络,以电影类型结点为中心,对异构网络进行社团划分,筛选出符合要求的社团,提高其运算速度和效率,利用异构网络中的元路径,计算目标用户与社团中的每个用户之间的影响力,计算目标用户与电影类型的喜爱程度,特征建模,分析目标用户的每一个特征被划分到每种电影类型的概率,综合计算目标用户对每个电影类型的喜爱程度,对链接建模和特征建模的结果进行加权求和,分析目标用户对每一种电影类型的喜爱程度,按照目标用户对每一种电影类型的喜爱程度,选择电影类型,推荐评分高的电影。
搜索关键词: 电影类型 异构网络 电影 分析目标 计算目标 目标用户 特征建模 异构信息 社团 建模 结点 链接 综合计算 求和 构建 加权 运算 网络 筛选 概率
【主权项】:
1.一种基于异构信息网络的电影推荐方法,其特征在于,包括以下步骤:步骤1,链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户‑电影异构网络,并计算用户与电影类型之间的权值,具体是:定义用户‑电影异构网络模型G=(V,E,W),其中V=Vu∪Vm∪Vt,Vu表示用户集合,Vm表示电影集合,Vt表示电影类型集合,E=Euu∪Emm∪Ett∪Eum∪Eut∪Emt,其中,Euu表示用户与用户之间的链接关系,Emm表示电影与电影之间的链接关系,Ett表示电影类型与电影类型之间的链接关系,Eum表示用户与电影之间的链接关系,Eut用户与电影类型之间的链接关系,Emt表示电影与电影类型之间的链接关系;其中W表示六种链接关系的权重集合,仅考虑用户之间的链接关系、电影类型之间的链接关系以及用户与电影类型之间的链接关系这三种链接关系;步骤2,以电影类型结点为中心,对异构网络进行社团划分,一种电影类型为一个社团,查找不同社团两两之间的共同结点,并计算电影类型之间的权值;包括:步骤2.1,利用元路径搜索将异构网络中不同类型的结点以电影类型为中心进行划分,具有相似特征的结点被划分到一个社团当中,划分的结果是社团内结点具有高内聚,社团间结点具有低耦合的特征;划分社团的个数就是电影类型的个数,每一个社团包含该电影类型以及对该电影类型相关的电影进行过评分的用户即喜爱该电影类型相关电影的用户群,一个社团可以包含多个用户,一个用户也可能存在多个社团中,实际实施时用户结点与相邻的电影类型结点的权值可以使用数组a[|Mtype|][|Mtypei|]来存储,|Mtype|表示电影类型种数,|Mtypei|表示属于第i种类型电影中的用户数量,a[i][j]表示第i种电影类型与该类型电影中第j个用户之间的权值,步骤2.2,基于计算电影类型之间的权值,其中Mi∩Mj表示这两种电影类型共同的电影集合,mk代表电影集合中的电影,而相应的gk,i代表用户i对于电影mk的评分;Mi∩Mj表示这两种类型电影的并集;步骤3,计算目标用户与每个社团即每个电影类型结点之间的相关程度,设置阀值,筛选出符合要求的社团;目标用户与每个社团之间的初始相关程度的计算与Dijkstra算法相似,唯一不同的在于,对于源点到其他结点的所有路径,Dijkstra算法得到的是最短距离,而在此计算的是所有路径长度的和;其中结点之间权值的计算分为两种,一种是用户结点与电影类型结点的权值,一种是电影类型结点之间的权值;步骤4,对于每一个符合要求的社团,基于目标用户到电影类型结点的初始相关程度,计算目标用户与社团中的每个用户之间的影响力,其中,用户之间的影响力就是用户之间的相似性,其计算步骤为,确定与目标用户存在元路径的用户,计算元路径每一段路径的权值,根据元路径复合规则计算两用户之间的相似性;具体包括:步骤4.1、两个电影用户之间的相互影响力计算依据用户间的元路径,用户之间的相互影响包括直接影响和间接影响;所述间接影响为用户之间存在一条路径,用户影响力依靠路径影响彼此相邻结点;所述直接影响为结点之间有链接关系,即彼此为相邻结点,那么彼此之间存在直接影响力;两个结点之间的存在多条间接影响路径;对于两结点之间存在直接联系又有间接联系,他们的相互影响是两种影响的叠加;这种影响力大小定义为公式计算,当i,j为不相邻结点时当i,j相邻时,sim(i,j)=wi,j,其中n表示结点i,j之间的路径数目,m表示路径序号,Nb(i,j)表示结点i,j每一条路径的连接点结点集合,符号⊕表示影响力在路径中不同阶段的连接方式,因为结点间随着路径长度加长,影响会逐渐变弱,即路径越长影响力越小,当结点i,j是相邻结点时,使用步骤1中的链接关系的权值,当不是相邻结点时并且元路径较长时,就将元路径以某一结点分为两段,这样反复下去直到元路径只有两个相邻结点;步骤4.2、元路径将用户之间的链接关系、电影类型之间的链接关系以及用户与电影类型之间的链接关系这三种类型的链接进行构建;在用户‑电影异构网络中,对于用户与用户之间的间接关系,起到连接作用的是电影类型结点,当用户都喜爱某一种类型的电影,可以认为彼此之间能够产生影响;用户之间的影响力计算公式使用Sim(u0,uij)=l(Mtypei)*a[Mtypei][j]来计算,其中,Mtypei表示第i种电影类型,l(Mtypei)表示目标用户u0到第i种电影类型的初始相关程度,a[Mtypei][j]表示该电影类型结点到该电影类型所代表的社团中的第j个用户uij的权值;步骤5,计算目标用户与符合要求的社团所代表的电影类型的喜爱程度,用目标用户与社团中每一个用户之间的影响力的均值来表示,社团中各结点对目标用户影响力的平均值作为用户划分到该社团的概率,即目标用户对于该社团所代表的电影类型的喜爱程度,平均值越大,目标用户划分到该社团概率越大,喜爱对应类型电影可能性越高;令目标用户划分到社团ck的概率为P2(ck|u0),其计算过程如公式其中,uk属于社团ck中的用户结点,|ck|表示其中结点的个数,sim(u0,uk)表示目标用户u0和uk之间的相互影响力;步骤6,特征建模,基于经典朴素贝叶斯分类进行用户单个特征属性分类,分析目标用户的每一个特征被划分到每种电影类型的概率;具体包括:步骤6.1,定义用户各个特征属性之间相互独立,对用户单个特征属性进行建模分类,目的在于分析用户单个特征属于每个电影类型的概率;在用户‑电影异构网络中,对特征属性进行建模时,用Xv表示对象V的特征属性,相应地,针对文中的研究对象用户ui来说,Xui代表其特征属性集合;考虑电影用户有多个特征属性,因此Xui是一个向量,表示为Xui={Xui,1,Xui,2,...,Xui,j,Xui,n},其中n=|Xui|为属性个数;步骤6.2,目标用户单个特征属性属于某个电影类型的概率用P(ck|Xui,j)表示,P(Xui,j|ck)表示在电影类型ck中用户ui的第j个属性Xui,j所占的比率,Xui,j|ck服从高斯分布,即P(ck)表示属于电影类型ck的电影占所有电影的比例,从数据中可以直接统计获取,P(Xui,j)表示属性Xui,j的概率,定义所有属性概率相同,即P(Xui,j)=P(Xuj,i),i≠j;由贝叶斯定理得两者之间关系如公式P(ck|Xui,j)=P(Xui,j|ck)×P(ck)/P(Xui,j)对于单个特征属性Xui,j建模完成以后,同样的,用户其他特征属性也相应的得到建模,从而每个用户的每个属性都得到了建模;依据贝叶斯定理可以得出每个用户的每个属性属于某个电影类型的概率;步骤7,基于目标用户的每一个特征被划分的概率,综合计算目标用户对每个电影类型的喜爱程度;具体包括:复合特征属性建模,综合考虑所有用户特征属性,从用户自身角度分析用户属于某个电影类型的概率,喜爱某种类型电影的可能性;是将每个用户的每个属性分类结果综合起来考虑,利用对用户属性的分类进而完成对用户的分类,其主要思想是如果用户所有属性同时划分到某一类型的概率比较大,那么目标用户划分到该类型的可能性就比较大,即认为目标用户喜爱对应类型的电影可能性就比较高;用P(ck|u0)表示u0划分到电影类型ck的概率;由用户各个特征属性之间相互独立,得到公式Xu0,j|ck服从高斯分布,即结合步骤6中目标用户的每一个特征被划分到每种电影类型的概率公式可以得到用户属于每一个电影类型的概率公式步骤8,结合步骤5与步骤7中分别得出的用户对每一种电影类型的喜爱程度,进行加权求和,分析目标用户对每一种电影类型的喜爱程度;步骤9,按照目标用户对每一种电影类型的喜爱程度,选择电影类型,推荐评分高的电影,具体是,选择用户喜爱程度最高的前k种电影类型,分别从这些电影类型中选择评分高于一定值的前m部电影推荐给目标用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611248620.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top