[发明专利]语音标注系统、方法、终端及存储介质在审
申请号: | 202210197982.2 | 申请日: | 2022-03-02 |
公开(公告)号: | CN114582328A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 杨磊;陈震;段志峰;张庆;刘国平 | 申请(专利权)人: | 上海钧正网络科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/22;G10L25/27;G10L25/45 |
代理公司: | 上海文舜致远专利代理事务所(普通合伙) 31445 | 代理人: | 许红英 |
地址: | 201199 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 标注 系统 方法 终端 存储 介质 | ||
1.一种语音标注系统,其特征在于,包括:
数据安全模块,用于执行系统中各模块的数据安全处理;
数据搜集模块,用于采集原始语音数据,并对所述原始语音数据进行预处理得到预处理语音数据;
标注实施模块,用于经所述数据安全模块获取所述预处理语音数据,并对其进行标注后生成语音标注数据;
方案设计模块,用于响应于用户操作,经所述数据安全模块获取所需的语音标注数据以作为模型训练数据。
2.如权利要求1所述的语音标注系统,其特征在于,所述数据安全模块执行系统中各模块的数据安全处理包括:对所述数据搜集模块、标注实施模块、方案设计模块进行数据治理、数据分隔和数据安全传输。
3.如权利要求1所述的语音标注系统,其特征在于,所述数据搜集模块对所述原始语音数据进行预处理,包括:
进行数据采集预处理,包括:自动采集线上用户语音数据,和/或由人工提交线下用户语音数据;
进行数据转换预处理,包括:对采集到的原始语音数据进行文件格式转换和数据内容整理,以及制作语音属性信息集合并创建唯一语音ID,以根据所述唯一语音ID将原始语音数据与语音属性信息相关联;
进行数据加载,包括:将原始语音数据与语音属性信息经安全处理后保存至存储介质中;其中,所述原始语音数据保存至OSS对象存储服务中,所述语音属性信息存储至数据库中。
4.如权利要求1所述的语音标注系统,其特征在于,所述标注实施模块包括:AI辅助子模块、标注服务子模块、质检服务子模块;所述AI辅助子模块又包括辅助标注模块和辅助质检模块;其中:
所述AI辅助子模块用于从存储介质中获取原始语音数据,并通过所述辅助标注模块对所述原始语音数据进行语音识别和预标注处理生成语音预标注数据;
所述标注服务子模块用于从所述AI辅助子模块获取所述语音预标注数据,对其进行人工核对标注得到人工更正数据,并将所述人工更正数据保存至所述存储介质中;
所述AI辅助子模块从所述存储介质中获取纯人工标注数据并通过所述辅助质检模块对其进行辅助质检,并将辅助质检后的质检问题数据发送至所述质检服务子模块,以进行人工修复,并将修复数据存至所述存储介质中。
5.如权利要求1所述的语音标注系统,其特征在于,所述AI辅助子模块对原始语音数据进行语音识别处理的方式包括:利用短时傅里叶变换算法和理想二值掩膜算法进行语音分离,生成降噪后的语音幅度谱。
6.如权利要求5所述的语音标注系统,其特征在于,所述AI辅助子模块对短时傅里叶变换算法和理想二值掩膜算法做如下优化:
根据语音交互场景类型预设场景噪音,将所述场景噪音与纯净的目标人声混合生成训练语音集合;
根据所述语音交互场景类型,采用基于指数时间函数的窗函数计算短时傅里叶变换算法中的窗口长度;
由理想比值掩蔽算法替代所述理想二值掩膜算法,以使算法结果从二值选择优化为多个连续值选择;
搜集用户主流场景下的噪音,与纯净的目标人声混合生成有预期结果的训练语音集合,以进行有监督训练。
7.如权利要求4所述的语音标注系统,其特征在于,所述AI辅助子模块从所述存储介质中获取纯人工标注数据并通过所述辅助质检模块对其进行辅助质检的方式包括:利用词错误率算法和句错误率算法进行语音质量质检。
8.一种语音标注方法,其特征在于,包括:
采集原始语音数据并对所述原始语音数据进行预处理得到预处理语音数据;
对所述预处理语音数据进行标注后生成语音标注数据;
响应于用户操作,从所述语音标注数据中获取所需的语音标注数据,以作为模型训练数据。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求8所述的语音标注方法。
10.一种语音标注终端,其特征在于,包括处理器和存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求8所述的语音标注方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海钧正网络科技有限公司,未经上海钧正网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210197982.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烹饪器具及其制备方法
- 下一篇:光通信感知传能一体化无人机系统