[发明专利]基于倒排索引的视频召回方法在审
申请号: | 202011233202.2 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112347302A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 闫立鑫;韩亚;吴廷峰;吴上波 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F16/71 | 分类号: | G06F16/71;G06F16/735;G06F16/78 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 索引 视频 召回 方法 | ||
本发明涉及视频推荐技术领域,本发明旨在解决现有的视频候选集召回方法存在匹配速度慢的问题,提出一种基于倒排索引的视频召回方法,技术方案概括为:对视频资源按预设规则进行筛选后存入视频库中;根据用户行为数据确定与用户行为相关视频的标签权重;根据用户在搜索引擎输入的视频信息建立倒排索引,确定各视频信息的标签所属类型权重;确定与用户行为相关视频的各视频信息,并根据与用户行为相关视频的标签权重和对应视频信息的标签所属类型权重确定出与用户行为相关视频的最终权重,根据最终权重在视频库中匹配相似视频,选取相似度得分大于预设阈值的相似视频作为视频召回的目标。本发明减少了视频候选集匹配的时间,适用于影片推荐。
技术领域
本发明涉及视频推荐技术领域,具体来说涉及一种基于倒排索引的视频召回方法。
背景技术
随着互联网技术的飞速发展和智能电视的普及,越来越多的用户使用智能电视的视频推荐功能,其实质就是利用用户一些行为,并通过一些算法推测出用户可能喜欢的视频。
现有技术进行标签召回物品候选集时,通常利用人工对物品进行标签化表示,然后采用标签向量化,利用查询标签向量与物品标签向量乘积计算出相似度,通过相似度评估用户对物品喜欢程度。
但是在标签转向量的过程中,由于过去一段时间的用户观看行为可能转化多几个甚至十几个标签的喜好,一个候选影片通常具有多个标签,容易出现高维向量,加上本身用户日观看行为基数百万级别,每个类型候选集多达几千部甚至几万部,例如电视剧类型候选集五千部左右,而电影类型候选集达到两三万数量级别,往往导致两者之间的向量乘积运算时空间复杂度和时间复杂度高,一次完整的运算耗时达到几小时,明显具有运算速度较慢的弊端。
发明内容
本发明旨在解决现有的视频候选集召回方法存在匹配速度慢的问题,提出一种基于倒排索引的视频召回方法。
本发明解决上述技术问题所采用的技术方案是:基于倒排索引的视频召回方法,包括以下步骤:
步骤1、获取视频资源,对所述视频资源按预设规则进行筛选后存入视频库中;
步骤2、获取用户行为数据,根据所述用户行为数据确定与用户行为相关视频的标签权重,所述标签权重用于表示用户对相关视频的喜好程度;
步骤3、根据用户在搜索引擎输入的视频信息建立倒排索引,基于所述倒排索引确定各视频信息的标签所属类型权重,所述标签所属类型权重用于表示用户对各视频信息的喜好程度;
步骤4、确定与用户行为相关视频的各视频信息,并根据与用户行为相关视频的标签权重和对应视频信息的标签所属类型权重确定出与用户行为相关视频的最终权重,根据与用户行为相关视频的最终权重在视频库中匹配相似视频,选取相似度得分大于第一预设阈值的相似视频作为视频召回的目标。
进一步的,步骤1中,所述对视频资源按预设规则进行筛选包括:
根据视频时长剔除非正片的视频资源,剔除评分低于第二预设阈值的视频资源。
进一步的,步骤2中,所述用户行为数据至少包括:用户对视频的观看时长。
进一步的,步骤3中,所述根据用户在搜索引擎输入的视频信息建立对应视频的倒排索引包括:
将用户在搜索引擎输入的视频信息不进行分词处理,建立视频信息与具有该视频信息的视频的索引关系,从而建立对应视频的倒排索引文件。
进一步的,所述各视频信息的标签所属类型权重的确定方法包括:根据用户在预设时间段内对视频的点击率,确定该视频在倒排索引文件中具有索引关系的视频信息的标签所属类型权重。
进一步的,步骤4中,所述与用户行为相关视频的最终权重的确定方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011233202.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:大掺量固废混凝土及其制备方法
- 下一篇:一种个性化服装设计系统及方法