[发明专利]语音检测方法、装置、介质和计算设备在审
申请号: | 202011146246.1 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112331229A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 马慧超;段亦涛;孙艳庆 | 申请(专利权)人: | 网易有道信息技术(北京)有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/27 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 郭丽祥;武晨燕 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 检测 方法 装置 介质 计算 设备 | ||
本发明的实施方式提供了一种语音检测方法、装置、介质和计算设备。该方法包括:获取参考文本对应的待检测语音;基于所述参考文本所对应的目标识别网络对所述待检测语音进行处理,确定所述待检测语音包含的至少一个音素对应的标签;若所述至少一个音素对应的标签中存在连读标签,则确定所述待检测语音中存在连读;其中,所述连读标签为多种连读标签中至少之一;所述多种连读标签中不同的连读标签对应不同的连读规则。
技术领域
本发明的实施方式涉及音频信息处理领域,更具体地,本发明的实施方式涉及一种语音检测方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
相关技术中,语音检测可以被用于进行语音测评,语音测评被广泛用于语音的连读检测处理中。其中,所述语音的连读检测指的是对用户输入的语音是否在某两个单词之间发生连读的检测。然而,相关技术的连读检测中,无法对多种连读规则进行检测,因此无法满足更多的语言的连读检测的需求。
发明内容
本发明期望提供一种语音检测方法、装置、介质和计算设备,以至少解决上述技术问题。
在本发明实施方式的第一方面中,提供了一种语音检测方法,包括:
获取参考文本对应的待检测语音;
基于所述参考文本所对应的目标识别网络对所述待检测语音进行处理,确定所述待检测语音包含的至少一个音素对应的标签;
若所述至少一个音素对应的标签中存在连读标签,则确定所述待检测语音中存在连读;其中,所述连读标签为多种连读标签中至少之一;所述多种连读标签中不同的连读标签对应不同的连读规则。
在本发明的一个实施例中,所述方法还包括:
基于所述参考文本中每一个单词所对应的子识别网络,构建目标识别网络;其中,所述参考文本中的至少部分单词所对应的子识别网络包含单词的结束音素所对应多种连读标签的多条支路;所述目标识别网络中包含至少一条路径,所述至少一条路径的部分路径中包含至少部分单词的结束音素对应的连读标签的支路。
在本发明的一个实施例中,所述基于参考文本中每一个单词所对应的子识别网络,构建目标识别网络,包括:
基于所述参考文本包含的多个单词的先后顺序,依次将所述参考文本中相邻两个单词中的第一个单词对应的子识别网络中结束音素对应的至少一条支路的节点与第二个单词对应的子识别网络起始音素对应的至少一条支路的节点相连,得到所述目标识别网络。
在本发明的一个实施例中,所述方法还包括:
对所述目标识别网络中符合第一预设条件的支路进行剪枝,得到剪枝后的所述目标识别网络;
其中,所述第一预设条件包括:相邻两个单词中第一个单词的结束音素的支路的连读标签所对应的连读规则,与所述相邻两个单词的所述第一个单词的结束音素与第二个单词的起始音素之间的连读规则不匹配。
在本发明的一个实施例中,所述基于所述参考文本所对应的目标识别网络对所述待检测语音进行处理,确定所述待检测语音包含的至少一个音素及其对应的标签,包括:
基于所述目标识别网络对所述待检测语音进行对齐处理,得到所述待检测语音所对应的目标路径;
基于所述目标路径确定所述待检测语音包含的至少一个音素及其对应的标签。
在本发明的一个实施例中,所述基于所述目标识别网络对所述待检测语音进行对齐处理,得到所述待检测语音所对应的目标路径,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011146246.1/2.html,转载请声明来源钻瓜专利网。