[发明专利]一种字幕内容的纠错方法和装置在审
申请号: | 201710624479.X | 申请日: | 2017-07-27 |
公开(公告)号: | CN107277645A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 王金龙 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/435 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆 |
地址: | 523860 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 内容 纠错 方法 装置 | ||
技术领域
本发明实施例涉及多媒体技术,尤其涉及一种字幕内容的纠错方法和装置。
背景技术
通常在音视频的字幕制作时,一般是一边看视频或者边听音频,一边录入字幕文本,而录好的字幕文本内容是否与视频中的音频内容相符或对应,影响用户观看视频或收听音频的体验。
现有技术中通常是人工去检查,反复核对去发现问题。人工纠错带来的结果是效率地下,投入成本高。
发明内容
本发明实施例提供一种字幕内容的纠错方法和装置,实现了对字幕内容的智能纠错,解决人工纠错效率低下以及投入成本高的问题。
第一方面,本发明实施例提供了一种字幕内容的纠错方法,所述方法包括:
提取视频文件中目标字幕条对应的第一文本信息;
识别所述目标字幕条的音频信息得到对应的第二文本信息;
将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。
进一步的,所述提取视频文件中目标字幕条的第一文本信息包括:
判断当前图像帧是否有字幕,若是,则确定所述字幕条的位置以及所述字幕条的起始帧和终止帧;
提取所述字幕条的第一文本信息。
进一步的,所述识别所述目标字幕条的音频信息对应的第二文本信息包括:
根据所述起始帧和所述终止帧确定时间间隔;
根据所述时间间隔解析和切割视频中的音频信息;
将解析和切割后的音频信息与预设文本库进行比对,识别所述音频信息对应的第二文本信息。
进一步的,所述将所述第一文本信息和所述第二文本信息通过文本比对进行纠错,输出纠错结果包括:
将所述第一文本信息和所述第二文本信息以字或词语为单位一一进行比对;
记录所述第二文本中与所述第一文本不同的字或词语;
将所述字或词语作为纠错结果进行输出。
进一步的,所述预设文本库存储在与语音识别模块相连的服务器中。
第二方面,本发明实施例提供了一种字幕内容的纠错装置,所述装置包括:
信息提取模块,用于提取视频文件中目标字幕条对应的第一文本信息;
信息识别模块,识别所述目标字幕条的音频信息得到对应的第二文本信息;
信息比对模块,用于将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。
进一步的,所述信息提取模块具体用于:
判断当前图像帧是否有字幕,若是,则确定所述字幕条的位置以及所述字幕条的起始帧和终止帧;
提取所述字幕条的第一文本信息。
进一步的,所述信息识别模块具体用于:
根据所述起始帧和所述终止帧确定时间间隔;
根据所述时间间隔解析和切割视频中的音频信息;
将解析和切割后的音频信息与预设文本库进行比对,识别所述音频信息对应的第二文本信息。
进一步的,所述信息比对模块具体用于:
将所述第一文本信息和所述第二文本信息以字或词语为单位一一进行比对;
记录所述第二文本中与所述第一文本不同的字或词语;
将所述字或词语作为纠错结果进行输出。
进一步的,所述预设文本库存储在与语音识别模块相连的服务器中。
本发明实施例中,提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。实现了对字幕内容的智能纠错,解决人工纠错效率低下以及投入成本高的问题。
附图说明
图1是本发明实施例一中的一种字幕内容的纠错方法的流程图;
图2是本发明实施例二中的一种字幕内容的纠错方法的流程图;
图3是本发明实施例三中的一种字幕内容的纠错方法的流程图;
图4是本发明实施例四中的一种字幕内容的纠错装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710624479.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:弹幕内容的发送方法及客户端
- 下一篇:一种音视频资源的字幕配置系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法