[发明专利]一种音视频资源的字幕配置系统在审
申请号: | 201710670936.9 | 申请日: | 2017-08-08 |
公开(公告)号: | CN107277646A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 李强;王凤琴 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/485;H04N21/472 |
代理公司: | 四川省成都市天策商标专利事务所51213 | 代理人: | 秦华云,刘渝 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 资源 字幕 配置 系统 | ||
技术领域
本发明涉及字幕配置技术领域,特别涉及一种音视频资源的字幕配置系统。
背景技术
在观看音视频节目时,由于语言方面的问题,很多音视频内容没有配置相应的字幕,作为观看的用户,有时候不能理解节目内容的意思。还有各种音视频出版物,有些节目内容可能部分包含了地方方言,还有些节目内容原本就是英文原版、德文原版、或者是日文原版的音视频,一旦没有配置字幕,观众很难准确理解其意思。这些都给人们带来一定的不便。
针对此问题,传统的解决方案是,针对指定的音视频节目内容,通过人工翻译其语音内容,并把翻译后的内容以字幕文件的方式提供,电子播放设备在播放这些音视频节目内容时,会自动把相关的字幕加入到视频的下方。
但是该解决方案能解决的音视频节目内容的数量有限且仅针对指定的音视频节目,故目前仍存在大量的无字幕音视频节目或需翻译为其他需求的语种的音视频节目。
发明内容
本发明的目的是克服上述背景技术中不足,提供一种可自动根据用户需求为音视频节目配置字幕或自动翻译音视频节目音频中的内容,并以字幕的形式配置于音视频节目中的音视频资源的字幕配置系统。
为了达到上述的技术效果,本发明采取以下技术方案:
一种音视频资源的字幕配置系统,应用于可播放音视频资源的电子播放设备中,所述电子播放设备包含播放显示模块及指令获取模块,所述字幕配置系统包含设置模块、录音模块、存储模块、数据传输模块、字幕显示模块及远程服务端;其中,
所述播放显示模块用于播放音视频资源文件,且分别与录音模块、存储模块、字幕显示模块电连接;所述设置模块包含字幕配置启动单元,所述字幕配置启动单元用于发送用户启动字幕配置的操作指令,且字幕配置启动单元与指令获取模块电连接;所述指令获取模块嵌于电子播放设备中、用于接收设置模块发送的操作指令,且与录音模块及存储模块电连接;所述录音模块用于对播放显示模块中播放的音视频资源文件进行录音并生成相应的音频文件,录音模块与存储模块电连接;
所述存储模块用于保存录音模块录制的音频文件及收到的用户的操作指令,且存储模块与所述数据传输模块及字幕显示模块电连接;所述数据传输模块用于向远程服务端发送音频文件并接收远程服务端返回的文件数据,且数据传输模块与远程服务端通信连接;所述字幕显示模块用于显示字幕且与数据传输模块电连接;所述远程服务端包含语音识别引擎,所述语音识别引擎用于识别收到的音频文件的语音内容并转为对应的文字信息文本,所述远程服务端用于接收数据传输模块发送的音频文件并将所述文字信息文本返回到数据传输模块;
当用户需要将音视频节目配置字幕时,可通过设置模块的字幕配置启动单元发出启动字幕配置的操作指令从而启动系统的字幕配置程序,指令获取模块收到启动指令后向录音模块发送开始录音的信号并将用户发出的指令保存至存储模块中;录音模块收到开始录音的信号后即对当前播放显示模块上播放的音视频节目内容进行实时录音,并以音频文件的方式存储至存储模块中;数据传输模块则将存储模块的音频文件上传至远程服务端并调用相关的云服务的语音识别引擎对音频文件进行语音识别同时转为相应的文字信息文本;远程服务端再将该文字信息文本返回数据传输模块,字幕显示模块将文字信息文本以字幕文字的形式在屏幕上展现给用户,从而完成字幕配置。
进一步地,所述设置模块包含字幕语种设定单元,所述字幕语种设定单元用于发送字幕配置时用户需求语种的指令信息,用户可根据需求通过字幕语种设定单元设置需求的字幕语种,且所述字幕语种设定单元与所述指令获取模块电连接;所述数据传输模块同时向远程服务端发送需配置字幕的音频文件及用户需求语种的指令信息。
进一步地,所述远程服务端包含语种识别单元及第三方翻译服务器;所述语种识别单元用于识别所述远程服务端收到的音频文件内包含的语音内容所对应的语种,并判定该语种与用户需求语种是否一致;若语种识别单元识别到的音频文件的语种与用户需求语种不一致时,则将向第三方翻译服务器发送将所述远程服务端转换的所述文字信息文本的文字翻译为用户需求的语种文字的请求,所述第三方翻译服务器则将所述远程服务端转换的所述文字信息文本的文字翻译为用户需求的语种文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710670936.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种字幕内容的纠错方法和装置
- 下一篇:视频文件切割方法及装置