[发明专利]评测语音的方法和装置有效
申请号: | 201911171941.0 | 申请日: | 2019-11-26 |
公开(公告)号: | CN112951277B | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 欧志刚;高芸;李晓冬 | 申请(专利权)人: | 新东方教育科技集团有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/78;G10L25/30 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 孙涛;毛威 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评测 语音 方法 装置 | ||
本申请提供了一种评测语音的方法,包括:获取待测语音对应的第二音频特征数据和第二音素数据,所述待测语音与第二字符存在对应关系;通过神经网络处理所述第二音频特征数据和所述第二音素数据,生成第一特征向量,所述第一特征向量用于指示所述待测语音的音频特征,所述神经网络为使用训练语音对应的第一音素数据和第一音频特征数据训练得到的;根据所述第一特征向量评测所述待测语音。绝大部分字符的发音都可以归纳为音素集合中全部或部分音素的组合,因此,相比于单纯依靠一种数据训练神经网络,通过音素和音频特征联合训练神经网络能够提高神经网络的预测准确率,使用该神经网络进行语音评测能够提高语音评测的准确度。
技术领域
本申请涉及人工智能领域,具体涉及一种评测语音的方法和装置。
背景技术
语音评测是语音练习领域的一个环节,例如,在用户学习英语的过程中,需要对发音进行评测,以确定发音是否准确。一种对单词发音进行评测的方法是基于整句或者整段发音进行打分,该方法需要对待测语音进行分割处理和对齐处理,确定每个音素所对应的语音帧,再进行评测。
由于噪音等因素的存在,在对待测语音进行分割处理和对齐处理时不可避免地会出现误差,从而导致评测结果的准确度下降。因此,如何提高语音评测的准确度是当前需要解决的问题。
发明内容
本申请提供一种评测语音的方法和装置,能够提高语音评测的准确度。
第一方面,提供了一种评测语音的方法,包括:获取待测语音对应的第二音频特征数据和第二音素数据,所述待测语音与第二字符存在对应关系;通过神经网络处理所述第二音频特征数据和所述第二音素数据,生成第一特征向量,所述第一特征向量用于指示所述待测语音的音频特征,所述神经网络为使用第一音素数据和第一音频特征数据训练得到的,所述第一音素数据和第一音频特征数据为训练语音对应的数据,并且,所述训练语音与第一字符存在对应关系;根据所述第一特征向量评测所述待测语音。
绝大部分字符的发音都可以归纳为音素集合中全部或部分音素的组合,因此,相比于单纯依靠一种数据训练神经网络,通过音素和音频特征联合训练神经网络能够提高神经网络的预测准确率,使用该神经网络进行语音评测能够提高语音评测的准确度。
第二方面,提供了一种训练神经网络的方法,包括:获取第一字符对应的第一音频特征数据和第一音素数据;根据所述第一音频特征数据和所述第一音素数据训练神经网络。
绝大部分字符的发音都可以归纳为音素集合中全部或部分音素的组合,因此,相比于单纯依靠一种数据训练神经网络,通过音素和音频特征联合训练神经网络能够提高神经网络的预测准确率,使用该神经网络进行语音评测能够提高语音评测的准确度。
第三方面,提供了一种评测语音的装置,该装置包括输入单元和处理单元,
所述输入单元用于:获取待测语音对应的第二音频特征数据和第二音素数据,所述待测语音与第二字符存在对应关系;
所述处理单元用于:通过神经网络处理所述第二音频特征数据和所述第二音素数据,生成第一特征向量,所述第一特征向量用于指示所述待测语音的音频特征,所述神经网络为使用第一音素数据和第一音频特征数据训练得到的,所述第一音素数据和所述第一音频特征数据为训练语音对应的数据,并且,所述训练语音与第一字符存在对应关系;
根据所述第一特征向量评测所述待测语音。
结合第三方面,在第三方面的第一种可能的实现方式中,
所述输入单元还用于:获取所述第二字符的标准语音对应的第三音频特征数据;
所述处理单元具体用于:通过所述神经网络处理所述第三音频特征数据和所述第二音素数据,生成第二特征向量,所述第二特征向量用于指示所述标准语音的音频特征;确定所述第一特征向量和所述第二特征向量的相似度;根据所述相似度评测所述待测语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新东方教育科技集团有限公司,未经新东方教育科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911171941.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体结构
- 下一篇:一种三维观测系统重建方法及系统