[发明专利]一种视频处理方法及装置有效
申请号: | 201911315628.X | 申请日: | 2019-12-19 |
公开(公告)号: | CN110990632B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 李振阳;李超;马连洋;衡阵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06N3/0464 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 蔡艾莹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 处理 方法 装置 | ||
1.一种视频处理方法,其特征在于,包括:
获取视频文本内容对应的第一拼音;
获取视频标题对应的第二拼音;
使用训练后的第一神经网络模型,分别得到所述第一拼音对应的第一拼音词向量、以及所述第二拼音对应的第二拼音词向量;
使用训练后的第二神经网络模型,得到所述第一拼音词向量与所述第二拼音词向量的相关性结果;
根据所述第一拼音词向量与所述第二拼音词向量的相关性结果,输出所述视频是否铺垫过长的处理结果;
所述获取视频文本内容对应的第一拼音的步骤包括:
根据视频的整体时长,确定需要获取的视频时长;
根据需要获取的视频时长,截取从视频开头开始、所述视频时长内的视频文本内容;
将所述文本内容转换为对应的第一拼音。
2.如权利要求1所述的视频处理方法,其特征在于,所述根据所述第一拼音词向量与所述第二拼音词向量的相关性结果,输出所述视频是否铺垫过长的处理结果的步骤包括:
若所述第一拼音词向量与所述第二拼音词向量相关,则输出所述视频未铺垫过长的处理结果;
若所述第一拼音词向量与所述第二拼音词向量不相关,则输出所述视频铺垫过长的处理结果。
3.如权利要求1所述的视频处理方法,其特征在于,所述获取视频文本内容对应的第一拼音的步骤还包括:
获取整个视频的文本内容;
定位每一文本内容在所述视频中的时间位置;
将所述文本内容转换为对应的第一拼音。
4.如权利要求3所述的视频处理方法,其特征在于,所述根据所述第一拼音词向量与所述第二拼音词向量的相关性结果,输出所述视频是否铺垫过长的处理结果的步骤包括:
根据所述第一拼音词向量与所述第二拼音词向量的相关性结果,筛选出与所述第二拼音词向量相关的所述第一拼音词向量,为目标第一拼音词向量;
根据所述目标第一拼音词向量在所述视频中的时间位置,判断所述视频是否铺垫过长;
若所述视频未铺垫过长,则输出所述视频未铺垫过长的处理结果;
若所述视频铺垫过长,则输出所述视频铺垫过长的处理结果。
5.如权利要求4所述的视频处理方法,其特征在于,所述根据所述目标第一拼音词向量在所述视频中的时间位置,判断所述视频是否铺垫过长的步骤包括:
若存在所述目标第一拼音词向量,使得所述目标第一拼音词向量在所述视频中的时间位置,落入所述视频未铺垫过长的判定标准内,则判定所述视频未铺垫过长;
若不存在所述目标第一拼音词向量,使得所述目标第一拼音词向量在所述视频中的时间位置,落入所述视频未铺垫过长的判定标准内,则判定所述视频铺垫过长。
6.如权利要求1至5任一所述的视频处理方法,其特征在于,所述获取视频的文本内容的步骤包括:
直接获取视频的字幕,并将所述字幕作为所述文本内容。
7.如权利要求1至5任一所述的视频处理方法,其特征在于,所述获取视频的文本内容的步骤包括:
获取所述视频的音频内容;
将所述音频内容转换为相对应的文本内容。
8.如权利要求1所述的视频处理方法,其特征在于,所述第一神经网络模型包括拼音词向量模型;所述视频处理方法还包括:
从视频库中获取训练样本;所述训练样本包括视频文本内容对应的拼音;
采用所述训练样本,使用连续词袋模型处理所述训练样本,得到所述拼音对应的拼音词向量;
将所述拼音作为所述拼音词向量模型的输入,所述拼音对应的拼音词向量作为所述拼音词向量模型的输出,对所述拼音词向量模型进行训练,得到训练后的第一神经网络模型。
9.一种视频处理装置,其特征在于,包括:
第一获取模块,用于获取视频文本内容对应的第一拼音;
第二获取模块,用于获取视频标题对应的第二拼音;
第一处理模块,包括训练后的第一神经网络模型,所述第一神经网络模型用于将所述第一拼音转换为对应的第一拼音词向量,将所述第二拼音转换为对应的第二拼音向量;
第二处理模块,包括训练后的第二神经网络模型,所述第二神经网络模型用于判定所述第一拼音向量和所述第二拼音向量的相关性;
输出模块,用于根据所述第一拼音向量和所述第二拼音向量的相关性结果,输出视频是否铺垫过长的处理结果;
所述获取视频文本内容对应的第一拼音的步骤包括:
根据视频的整体时长,确定需要获取的视频时长;
根据需要获取的视频时长,截取从视频开头开始、所述视频时长内的视频文本内容;
将所述文本内容转换为对应的第一拼音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911315628.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于语音识别的电动汽车充电导航系统设计
- 下一篇:移动终端支架