[发明专利]基于LDA用户主题模型的视频推荐方法有效
申请号: | 201610147676.2 | 申请日: | 2016-03-15 |
公开(公告)号: | CN105824911B | 公开(公告)日: | 2016-11-30 |
发明(设计)人: | 李玉军;张洁;陈默 | 申请(专利权)人: | 山东大学;泰邦泰平科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君恒知识产权代理事务所(普通合伙) 11466 | 代理人: | 张璐;林潮 |
地址: | 250100 *** | 国省代码: | 山东;37 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 公开了一种基于LDA用户主题模型的视频推荐方法,从历史数据库中提取所有视频,根据每个主题下的视频分布建立K个主题下的主题视频概率分布;根据用户的操作行为将历史数据库中的视频分为至少两个文档集,根据每个文档集的用户兴趣概率分布的权重对所有文档集的用户兴趣概率分布进行加权求和,得到所有用户在K个主题的用户主题概率分布;依据主题视频概率分布和用户主题概率分布生成视频推荐列表。通过分别对每个文档集的用户特征进行分析,能够更全面和准确地建立基于LDA的用户主题模型,提升视频推荐的准确率,并解决用户冷启动问题。 | ||
搜索关键词: | 基于 lda 用户 主题 模型 视频 推荐 方法 | ||
【主权项】:
一种基于LDA用户主题模型的视频推荐方法,其特征在于包括:S1、从历史数据库中提取所有视频,根据每个主题下的视频分布建立K个主题下的主题视频概率分布;S2、根据用户的操作行为将历史数据库中的视频分为至少两个文档集;针对每个文档集,根据单个用户的主题分布建立该文档集的用户兴趣概率分布;根据每个文档集的用户兴趣概率分布的权重对所有文档集的用户兴趣概率分布进行加权求和,得到所有用户在K个主题的用户主题概率分布;S3、依据所述主题视频概率分布和所述用户主题概率分布得到用户视频概率分布;基于所述用户视频概率分布生成视频推荐列表,基于所述视频推荐列表进行视频推荐;其中,K为主题数量,且K为整数;用户的操作行为包括:播放视频、收藏视频和点击视频;所述至少两个文档集包括:播放文档集、收藏文档集和点击文档集;视频t在主题k下的概率值为:式中,为播放文档集中不包含第i个词的视频t在主题k下出现的次数,为收藏文档集中视频t在主题k中出现的次数,为点击文档集中视频t在主题k中出现的次数,βt为视频t对应的狄里克雷超参数;k为整数,且1≤k≤K,K为主题数量;t为词袋中视频的编号;i为与每个用户对应的词的编号,i为正整数;V为视频数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学;泰邦泰平科技(北京)有限公司,未经山东大学;泰邦泰平科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610147676.2/,转载请声明来源钻瓜专利网。