[发明专利]一种切割段落音频的方法、系统、装置、介质在审
申请号: | 202010143849.X | 申请日: | 2020-03-04 |
公开(公告)号: | CN111429880A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 丁俊华;高淑君;王彦燕;李冬菊;刘文 | 申请(专利权)人: | 苏州驰声信息科技有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 陈松 |
地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 切割 段落 音频 方法 系统 装置 介质 | ||
1.一种切割段落音频的方法,其特征在于,包括以下步骤:
录入段落文本和音频;
判断是否存在音频,若存在音频,则将段落文本和音频上传,若不存在音频,则将段落文本进行语音合成;判断音频是否合成成功,若成功则将段落文本和音频上传,否则继续合成音频直至音频合成成功;
将对应的段落文本和音频作为一个任务包打包后进行段落切割;
对任务包中的音频,对应段落文本内容,进行段落切割,返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;
根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频。
2.根据权利要求1所述的一种切割段落音频的方法,其特征在于:录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频。
3.根据权利要求1所述的一种切割段落音频的方法,其特征在于:所述切割结果是对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间的时间戳信息。
4.一种切割段落音频的系统,其特征在于,包括通讯连接的:内容管理模块、任务处理模块、段落切割模块;
在内容管理模块中录入段落文本和音频;
判断是否存在音频,若存在音频,则将段落文本和音频上传到任务处理模块,若不存在音频,则将段落文本输入语音合成模块,合成音频,判断音频是否合成成功,若成功则将段落文本和音频上传到任务处理模块,否则继续合成音频直至音频合成成功;
任务处理模块将对应的段落文本和音频作为一个任务包发送给段落切割模块;
段落切割模块对任务包中的音频,对应段落文本内容,进行段落切割,向任务处理模块返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;
任务处理模块向切割结果回调给内容管理模块,内容管理模块根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频,内容管理模块能够按照段落文本中的句子,逐句跟读播放音频。
5.根据权利要求4所述的一种切割段落音频的系统,其特征在于:在内容管理模块中录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频。
6.根据权利要求4所述的一种切割段落音频的系统,其特征在于:所述段落切割模块能够对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间。
7.一种切割段落音频的装置,其特征在于,其包括:包括处理器、存储器以及程序;
所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行权利要求1所述的切割段落音频的方法。
8.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行权利要求1所述的切割段落音频的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州驰声信息科技有限公司,未经苏州驰声信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010143849.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于高压气体膨胀降温激发的太赫兹激光器
- 下一篇:一种控制方法及电子设备