[发明专利]一种爆破音的评测方法、装置、设备及存储介质有效
申请号: | 202110313338.2 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113077822B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 曾慧 | 申请(专利权)人: | 北京如布科技有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/27 |
代理公司: | 北京云知万象专利代理事务所(普通合伙) 16013 | 代理人: | 何辉 |
地址: | 100038 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 爆破 评测 方法 装置 设备 存储 介质 | ||
1.一种爆破音的评测方法,其特征在于:包括:
获取待评测的英语语音;
将所述英语语音送入解码图强制对齐进行识别,所述解码图包括带爆破音的第一发音路径和不带爆破音的第二发音路径;
如果识别过程采用解码图中的第二发音路径,则评测所述英语语音的发音失去爆破;
还包括:
如果识别过程采用解码图中的第一发音路径,且所述英语语音中第一单词的发音中预设辅音的发音时长小于预设时长,则评测所述英语语音的发音失去爆破;
还包括:
如果识别过程采用解码图中的第一发音路径,且所述英语语音中所述第一单词的发音中所述预设辅音的发音时长大于等于预设时长,以及所述预设辅音的发音的置信度大于置信度阈值,则评测所述英语语音的发音失去爆破。
2.根据权利要求1所述的方法,其特征在于,在将所述英语语音送入解码图进行强制对齐识别之前,还包括:
获取所述英语语音的参考文本,所述参考文本包括表示对预设辅音失去爆破的标记;
抽取所述参考文本中的标记,得到正常文本,并生成所述正常文本对应的识别语法;
生成所述参考文本中带有标记的第一单词对应的带爆破音的第一发音和不带爆破音的第二发音;
根据所述第一发音和第二发音编译所述识别语法,得到所述解码图,所述解码图中的第一发音路径对应第一发音,所述解码图中的第二发音路径对应第二发音。
3.根据权利要求1所述的方法,其特征在于,所述预设时长为30ms。
4.根据权利要求1所述的方法,其特征在于,所述置信度阈值的取值范围为[0.6,0.8]。
5.一种爆破音的评测装置,其特征在于,包括:
获取单元,设置为获取待评测的英语语音;
识别单元,设置为将所述英语语音送入解码图强制对齐进行识别,所述解码图包括带爆破音的第一发音路径和不带爆破音的第二发音路径;
评测单元,设置为如果识别过程采用解码图中的第二发音路径,则评测所述英语语音的发音失去爆破;
所述评测单元,还设置为如果识别过程采用解码图中的第一发音路径,且所述英语语音中第一单词的发音中预设辅音的发音时长小于预设时长,则评测所述英语语音的发音失去爆破;
所述评测单元,还设置为如果识别过程采用解码图中的第一发音路径,且所述英语语音中所述第一单词的发音中所述预设辅音的发音时长大于等于预设时长,以及所述预设辅音的发音的置信度大于置信度阈值,则评测所述英语语音的发音失去爆破。
6.一种设备,其特征在于,包括:
存储器,设置为存储一个或多个程序;
一个或多个处理器;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4任一项所述的方法。
7.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行实现如权利要求1-4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京如布科技有限公司,未经北京如布科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110313338.2/1.html,转载请声明来源钻瓜专利网。