[发明专利]基于人工智能的相似视频处理方法、装置及电子设备在审

申请号：	202011080112.4	申请日：	2020-10-10
公开（公告）号：	CN112203122A	公开（公告）日：	2021-01-08
发明（设计）人：	刘刚	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	H04N21/25	分类号：	H04N21/25;H04N21/258;H04N21/466
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	高天华;张颖玲
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于人工智能相似视频处理方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种基于人工智能的相似视频处理方法、装置、电子设备及计算机可读存储介质；涉及云技术领域的大数据技术；方法包括：对视频中的图像进行多个维度的特征提取处理，将提取得到的多个维度的特征向量进行融合处理，得到所述图像的图像向量；对所述视频中的音频进行特征提取处理，得到音频向量；对所述视频中的文本进行特征提取处理，得到文本向量；对所述图像向量、所述音频向量及所述文本向量进行融合处理，得到所述视频的视频表示向量；将任意两个视频的视频表示向量之间的向量相似度，作为所述两个视频之间的视频相似度；根据所述视频相似度，对所述两个视频进行处理。通过本申请，能够提升视频处理的精度。

技术领域

本申请涉及人工智能和大数据技术，尤其涉及一种基于人工智能的相似视频处理方法、装置、电子设备及计算机可读存储介质。

背景技术

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。计算机视觉技术(Computer Vision，CV)是人工智能的一个重要分支，主要研究如何建立能够从图像或者多维数据中获取信息的人工智能系统。

对于视频业务的提供商来说，通常需要借助计算机视觉技术以及涉及云技术的大数据处理技术，来判断两个视频之间是否相似，以保证视频业务的运营生态。在相关技术提供的方案中，通常是通过pHash算法或dHash算法来计算视频中图像的哈希值，并将两个视频中图像的哈希值之间的相似度，作为两个视频之间的视频相似度。但是，该种方式对于图像本身发生裁剪、平移或者拍摄视角角度有少量变化的情况非常敏感，局限性过高，得到的视频相似度的精度低。

发明内容

本申请实施例提供一种基于人工智能的相似视频处理方法、装置、电子设备及计算机可读存储介质，能够提升相似视频识别的精度。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种基于人工智能的相似视频处理方法，包括：

对视频中的图像进行多个维度的特征提取处理，将提取得到的多个维度的特征向量进行融合处理，得到所述图像的图像向量；

对所述视频中的音频进行特征提取处理，得到音频向量；

对所述视频中的文本进行特征提取处理，得到文本向量；

对所述图像向量、所述音频向量及所述文本向量进行融合处理，得到所述视频的视频表示向量；

将任意两个视频的视频表示向量之间的向量相似度，作为所述两个视频之间的视频相似度；

根据所述视频相似度，对所述两个视频进行处理。

在上述方案中，还包括：

获取针对历史用户的多条历史推荐记录；所述历史推荐记录包括所述历史用户的用户特征、已推荐视频的视频表示向量、以及所述历史用户对所述已推荐视频的触发结果；