[发明专利]视频与字幕的匹配方法和装置在审
申请号: | 201610139767.1 | 申请日: | 2016-03-11 |
公开(公告)号: | CN107181986A | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | 刘青;谢涛 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/44;H04N21/439;H04N21/234;H04N21/233 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 字幕 匹配 方法 装置 | ||
1.一种视频与字幕匹配方法,其特征在于,包括:
获取待匹配的视频片段和待匹配的一个或多个字幕文件;
从所获取的视频片段中提取出各个语音片段的关联语音时间信息以及从所述待匹配的一个或多个字幕文件中提取出字幕时间信息;
分别基于相同的规则,根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量;
基于所生成的视频特征向量和字幕特征向量,确定与所述视频片段匹配的字幕文件。
2.根据权利要求1所述的方法,其特征在于,从所获取的视频片段中提取出各个语音片段的关联语音时间信息包括:
从所获取的视频片段中提取出音频数据;
对所提取出的音频数据进行频谱分析,将符合语音频谱特性的音频数据作为语音数据;
基于所得到的语音数据,获取各个语音片段及对应的关联语音时间信息。
3.根据权利要求1或2所述的方法,其特征在于,所述关联语音时间信息是各个相邻语音片段之间的时间间隔信息,所述字幕时间信息是各个相邻字幕片段之间的时间间隔信息,以及
所述分别基于相同的规则,根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量包括:
分别基于相同的规则,根据各个相邻语音片段之间的时间间隔信息生成视 频片段的视频特征向量,以及根据各个相邻字幕片段之间的时间间隔信息,生成所述一个或多个字幕文件的字幕特征向量。
4.根据权利要求1或2所述的方法,其特征在于,所述关联语音时间信息是各个语音片段的时长信息,所述字幕时间信息是各个字幕片段的时长信息,以及
所述分别基于相同的规则,根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量包括:
分别基于相同的规则,根据各个语音片段的时长信息生成视频片段的视频特征向量,以及根据各个字幕片段的时长信息生成所述一个或多个字幕文件的字幕特征向量。
5.根据权利要求1-4任一所述的方法,其特征在于,基于所生成的视频特征向量和字幕特征向量,确定与所述视频片段匹配的字幕文件包括:
计算所生成的视频特征向量和字幕特征向量之间的空间相似度;以及
根据所计算出的空间相似度,确定与所述视频片段对应的目标字幕文件。
6.一种视频与字幕匹配装置,其特征在于,包括:
获取单元,用于获取待匹配的视频片段和待匹配的一个或多个字幕文件;
视频特征提取单元,用于从所获取的视频片段中提取出各个语音片段的关联语音时间信息;
字幕特征提取单元,用于从所述待匹配的一个或多个字幕文件中提取出字幕时间信息;
特征向量生成单元,用于分别基于相同的规则,根据所提取的关联语音时 间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量;
确定单元,用于基于所生成的视频特征向量和字幕特征向量,确定与所述视频片段匹配的字幕文件。
7.根据权利要求6所述的装置,其特征在于,视频特征提取单元包括:
音频数据提取模块,用于从所获取的视频片段中提取出音频数据;
语音数据获取模块,用于对所提取出的音频数据进行频谱分析,将符合语音频谱特性的音频数据作为语音数据;
关联语音时间信息获取模块,用于基于所得到的语音数据,获取各个语音片段及对应的关联语音时间信息。
8.根据权利要求6或7所述的装置,其特征在于,所述关联语音时间信息是各个相邻语音片段之间的时间间隔信息,所述字幕时间信息是各个相邻字幕片段之间的时间间隔信息,以及
所述特征向量生成单元用于分别基于相同的规则,根据各个相邻语音片段之间的时间间隔信息生成视频片段的视频特征向量,以及根据各个相邻字幕片段之间的时间间隔信息,生成所述一个或多个字幕文件的字幕特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610139767.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示设备及其操作方法
- 下一篇:播音系统及其传声装置与电子装置的控制方法