[发明专利]基于人工智能的相似视频处理方法、装置及电子设备在审
申请号: | 202011080112.4 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112203122A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 刘刚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/258;H04N21/466 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 高天华;张颖玲 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 相似 视频 处理 方法 装置 电子设备 | ||
本申请提供了一种基于人工智能的相似视频处理方法、装置、电子设备及计算机可读存储介质;涉及云技术领域的大数据技术;方法包括:对视频中的图像进行多个维度的特征提取处理,将提取得到的多个维度的特征向量进行融合处理,得到所述图像的图像向量;对所述视频中的音频进行特征提取处理,得到音频向量;对所述视频中的文本进行特征提取处理,得到文本向量;对所述图像向量、所述音频向量及所述文本向量进行融合处理,得到所述视频的视频表示向量;将任意两个视频的视频表示向量之间的向量相似度,作为所述两个视频之间的视频相似度;根据所述视频相似度,对所述两个视频进行处理。通过本申请,能够提升视频处理的精度。
技术领域
本申请涉及人工智能和大数据技术,尤其涉及一种基于人工智能的相似视频处理方法、装置、电子设备及计算机可读存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。计算机视觉技术(Computer Vision,CV)是人工智能的一个重要分支,主要研究如何建立能够从图像或者多维数据中获取信息的人工智能系统。
对于视频业务的提供商来说,通常需要借助计算机视觉技术以及涉及云技术的大数据处理技术,来判断两个视频之间是否相似,以保证视频业务的运营生态。在相关技术提供的方案中,通常是通过pHash算法或dHash算法来计算视频中图像的哈希值,并将两个视频中图像的哈希值之间的相似度,作为两个视频之间的视频相似度。但是,该种方式对于图像本身发生裁剪、平移或者拍摄视角角度有少量变化的情况非常敏感,局限性过高,得到的视频相似度的精度低。
发明内容
本申请实施例提供一种基于人工智能的相似视频处理方法、装置、电子设备及计算机可读存储介质,能够提升相似视频识别的精度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的相似视频处理方法,包括:
对视频中的图像进行多个维度的特征提取处理,将提取得到的多个维度的特征向量进行融合处理,得到所述图像的图像向量;
对所述视频中的音频进行特征提取处理,得到音频向量;
对所述视频中的文本进行特征提取处理,得到文本向量;
对所述图像向量、所述音频向量及所述文本向量进行融合处理,得到所述视频的视频表示向量;
将任意两个视频的视频表示向量之间的向量相似度,作为所述两个视频之间的视频相似度;
根据所述视频相似度,对所述两个视频进行处理。
在上述方案中,还包括:
获取针对历史用户的多条历史推荐记录;所述历史推荐记录包括所述历史用户的用户特征、已推荐视频的视频表示向量、以及所述历史用户对所述已推荐视频的触发结果;
根据所述多条历史推荐记录,对推荐模型的推荐参数进行更新;
将待推荐用户的用户特征与多个候选视频的视频表示向量分别进行组合处理,得到多个预测样本;
通过更新后的所述推荐模型,对所述预测样本进行预测处理,得到所述预测样本对应的候选视频的预测触发结果;
根据所述预测触发结果从所述多个候选视频中筛选出待推荐的视频,并执行针对所述待推荐的视频的推荐操作。
本申请实施例提供一种基于人工智能的相似视频处理装置,包括:
第一特征提取模块,用于对视频中的图像进行多个维度的特征提取处理,将提取得到的多个维度的特征向量进行融合处理,得到所述图像的图像向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011080112.4/2.html,转载请声明来源钻瓜专利网。