[发明专利]一种基于图挖掘的用户兴趣探测方法在审
申请号: | 202010281545.X | 申请日: | 2020-04-10 |
公开(公告)号: | CN111488488A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 黄睿智;范俊;李文杰;顾湘余 | 申请(专利权)人: | 杭州趣维科技有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/75;G06K9/62 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 董世博 |
地址: | 310012 浙江省杭州市西湖*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 挖掘 用户 兴趣 探测 方法 | ||
1.一种基于图挖掘的用户兴趣探测方法,其特征在于,具体包括如下步骤:
步骤S1:对视频库中的所有视频进行分类;
步骤S2:对不同类别的视频之间构建视频类别关系图;
步骤S3:计算转移概率以及个体用户对已播放的视频类别的喜好程度;
步骤S4:根据用户对已播放的视频类别的喜好程度以及不同类别视频间的转移概率,获得用户对未播放视频类别的喜好概率;
步骤S5:根据用户对未播放视频类别的喜好概率,进行排序,取设定个数的喜好概率最大的视频类别,作为兴趣探测类别;
步骤S6:将兴趣探测类别中的视频根据流行度进行排序,取流行度最高的一批视频作为推荐视频,推荐给用户。
2.根据权利要求1所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述步骤S2中构建视频类别关系图需要定义不同类别视频之间的相似度,通过式(2),计算视频类别i和视频类别j的相似度p(i,j):
其中N(i)表示视频类别i中的视频数量,N(j)表示视频类别j中的视频数量,|N(i)∩N(j)|表示视频类别i以及视频类别j中的总视频数量。
3.根据权利要求2所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述构建视频类别图包括如下步骤:
步骤a:定义视频类别图G=(V,E,P);
步骤b:通过式(2)计算任意两个不同类别视频之间的相似度,构建视频类别图;
步骤c:对步骤b中构建的视频类别图进行剪枝;
所述步骤a中V={v1,v2,…,vm}表示图中的顶点的集合,每个顶点v表示一个视频类别;E={e1,e2,…,ew}表示图中的边的集合,每条边e表示该边所连的两个视频类别之间的关系;P={p1,p2,…pw}表示图中的边权的集合,每个边权p表示对应视频类别之间的相似度。
4.根据权利要求3所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述步骤c中的剪枝需要设定边权阈值θ,将边权小于θ的边从视频类别图中删去。
5.根据权利要求1所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述步骤S3中,计算转移概率首先需要根据步骤S2的视频类别图得到其邻接矩阵A,邻接矩阵A中的元素表示顶点vi对应的视频类别i以及顶点vj对应的视频类别j之间的边权,其中i∈(1,m),j∈(1,m);根据设定的步长l能够得到经过l步用户从视频类别i转移到视频类别j的转移概率probability(i,j),如式(3)所示,
6.根据权利要求5所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述个体用户对已播放的视频类别的喜好程度根据个体用户的视频类别播放数据以及全体用户的视频类别播放数据得出。
7.根据权利要求6所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述步骤S4中,对于用户u及其一段时间内播放过的视频类别的集合I={i1,i2,…,in},nm;根据式(5)计算用户u对未播放过的视频类别j的喜好概率favour_pro(u,j):
其中favour(u,i)表示个体用户u对视频类别i的喜好程度。
8.根据权利要求1所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述步骤S1中根据视频类型或视频的年龄段对视频进行分类。
9.根据权利要求1所述的一种基于图挖掘的用户兴趣探测方法,其特征在于,所述步骤S6中的流行度通过播放量、点击量、播放时长以及转发率得出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州趣维科技有限公司,未经杭州趣维科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010281545.X/1.html,转载请声明来源钻瓜专利网。