[发明专利]一种发音纠正方法、装置、电子设备及存储介质有效
申请号: | 202011069449.5 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112185186B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 顾宇 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G09B5/04 | 分类号: | G09B5/04;G10L15/02 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发音 纠正 方法 装置 电子设备 存储 介质 | ||
1.一种发音纠正方法,其特征在于,包括:
从待测用户的语音信息中提取与话者无关的特征信息;
根据待测用户的所述与话者无关的特征信息获得所述待测用户的发音特征信息,其中,所述待测用户的发音特征信息由电磁发声动作扫描仪EMA特征表征;
根据所述待测用户的发音特征信息确定发音纠正方式;
所述根据待测用户的所述与话者无关的特征信息获得所述待测用户的发音特征信息,包括:将待测用户的所述与话者无关特征信息输入预先训练的电磁发声动作扫描仪EMA预测模型,获得所述待测用户的预测EMA特征;
所述从待测用户的语音信息中提取与话者无关的特征信息,包括:将待测用户的所述语音信息输入与话者无关的自动语音识别ASR模型;通过所述ASR模型从所述语音信息中提取语音后验概率PPG,并将所述PPG作为所述与话者无关的特征信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待测用户的发音特征信息确定发音纠正方式包括:
根据所述预测EMA特征确定发音纠正方式。
3.根据权利要求1所述的方法,其特征在于,所述将待测用户的所述与话者无关的特征信息输入预先训练的电磁发声动作扫描仪EMA预测模型,获得所述待测用户的预测EMA特征之前,还包括:
获取包含与话者无关的特征信息与EMA特征的样本;
通过所述样本对所述EMA预测模型进行训练,以确定所述EMA预测模型中与话者无关的特征信息与EMA特征的映射参数。
4.根据权利要求3所述的方法,其特征在于,所述将待测用户的所述与话者无关的特征信息输入预先训练的电磁发声动作扫描仪EMA预测模型,获得所述待测用户的预测EMA特征,包括:
将待测用户的所述与话者无关的特征信息输入预先训练的所述EMA预测模型;
通过所述映射参数获得所述待测用户的所述预测EMA特征。
5.根据权利要求2所述的方法,其特征在于,所述根据所述预测EMA特征确定发音纠正方式,包括:
获取与所述语音信息所对应的发音规则,其中,所述发音规则中包含所述语音信息在发音标准的情况下所对应的标准EMA特征;
将所述预测EMA特征与标准EMA特征进行对比,根据对比结果确定发音纠正方式。
6.根据权利要求5所述的方法,其特征在于,所述EMA特征包括:上唇位置信息、下唇位置信息、下巴位置信息和/或舌头位置信息。
7.根据权利要求6所述的方法,其特征在于,所述将所述预测EMA特征与标准EMA特征进行对比,根据对比结果确定发音纠正方式,包括:
将所述预测EMA特征与标准EMA特征进行对比,根据对比结果确定差值超过预设阈值的差异性位置信息;
根据所述差异性位置信息确定发音纠正方式。
8.一种发音纠正装置,其特征在于,包括:
与话者无关的特征信息提取模块,用于从待测用户的语音信息中提取与话者无关的特征信息;
发音特征信息获取模块,用于根据待测用户的所述与话者无关的特征信息获得所述待测用户的发音特征信息,其中,所述待测用户的发音特征信息由电磁发声动作扫描仪EMA特征表征;
发音纠正方式确定模块,用于根据所述待测用户的发音特征信息确定发音纠正方式;
所述发音特征信息获取模块,用于将待测用户的所述与话者无关特征信息输入预先训练的电磁发声动作扫描仪EMA预测模型,获得所述待测用户的预测EMA特征;
与话者无关的特征信息提取模块,用于将待测用户的所述语音信息输入与话者无关的自动语音识别ASR模型;通过所述ASR模型从所述语音信息中提取语音后验概率PPG,并将所述PPG作为所述与话者无关的特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011069449.5/1.html,转载请声明来源钻瓜专利网。