[发明专利]一种发音测评方法、介质、装置和计算设备在审
申请号: | 201910405363.6 | 申请日: | 2019-05-16 |
公开(公告)号: | CN111951825A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 杨晓飞;蒋成林;刘晨晨;沈欣尧;张欣;王治民;邓雅惠;高慧朝 | 申请(专利权)人: | 上海流利说信息技术有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/02 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 魏晓波 |
地址: | 200092 上海市杨浦区16*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发音 测评 方法 介质 装置 计算 设备 | ||
1.一种发音测评方法,其特征在于,包括:
从用户针对于测评内容的待测发音音频中提取至少一个音频数据段;
获取至少一个音频数据段对应的时间边界和相应时间边界内的声学似然度;
获取至少一个音频数据段对应的待测音素特征序列;
基于所述时间边界、混淆音素表和混淆音素对应的阈值,从所述待测音素特征序列中识别出与所述测评内容的标准音素特征序列不一致的待纠正音素;
若对应时间边界内存在所述待纠正音素,并且所述声学似然度大于预设门限,则基于所述待纠正音素调整对应的得分。
2.如权利要求1所述的方法,其中,还包括:
基于所述待纠正音素和/或调整后的得分来确定向用户推送的发音纠错内容,其中发音纠错内容用于指示用户对所述待纠正音素进行改进练习。
3.如权利要求1或2所述的方法,其中,采用音素识别网络来获取至少一个音频数据段对应的待测音素特征序列。
4.如权利要求3所述的方法,其中,由所述测评内容中的至少一个单词、发音词典和所述混淆音素表构建成所述音素识别网络;且
所述音素识别网络中每一网络路径的词图根据预先录入的开发集进行调整。
5.如权利要求1至4任一所述的方法,其中,所述基于所述时间边界、混淆音素表和混淆音素对应的阈值,从所述待测音素特征序列中识别出与所述测评内容的标准音素特征序列不一致的待纠正音素,包括:
获取基于所述测评内容生成的标准音素特征序列;
根据所述时间边界将至少一个音频数据段中每一单词对应的所述待测音素特征序列,与该单词对应的标准音素特征序列进行编辑距离对齐得到区别音素信息;
根据混淆音素表和混淆音素对应的阈值,通过贝叶斯判决模块确定所述区别音素信息对应的所述待纠正音素。
6.权利要求5所述的方法,其中,所述区别音素信息包括与标准音素特征序列不一致的音素处于所述待测音素特征序列中的位置信息。
7.如权利要求1至6任一所述的方法,其中,采用交叉熵准则CE模型获取至少一个音频数据段对应的时间边界和相应时间边界内的声学似然度。
8.一种发音测评装置,其特征在于,包括:
提取模块,被配置为从用户针对于测评内容的待测发音音频中提取至少一个音频数据段;
第一测评模块,被配置为获取至少一个音频数据段对应的时间边界和相应时间边界内的声学似然度;
第二测评模块,被配置为获取至少一个音频数据段对应的待测音素特征序列;基于所述时间边界、混淆音素表和混淆音素对应的阈值,从所述待测音素特征序列中识别出与所述测评内容的标准音素特征序列不一致的待纠正音素;
调整模块,被配置为若对应时间边界内存在所述待纠正音素,并且所述声学似然度大于预设门限,则基于所述待纠正音素调整对应的得分。
9.一种计算机可读存储介质,存储有程序代码,所述程序代码当被处理器执行时,实现如权利要求1-7之一所述的方法。
10.一种计算设备,包括处理器和存储有程序代码的存储介质,所述程序代码当被处理器执行时,实现如权利要求1-7之一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海流利说信息技术有限公司,未经上海流利说信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910405363.6/1.html,转载请声明来源钻瓜专利网。