[发明专利]一种语音识别方法、装置、设备及可读存储介质有效
申请号: | 201810385652.X | 申请日: | 2018-04-26 |
公开(公告)号: | CN108538292B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 吴思远;潘嘉 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王雨;王宝筠 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 可读 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
获取语音数据对应的第一识别结果;
在确定所述第一识别结果中包含指定类型符号对应的目标文字时,将所述第一识别结果中所述目标文字替换为对应的目标符号,得到第二识别结果;
分别将所述第一识别结果和所述第二识别结果输入预训练的文本合理性判定模型,得到所述文本合理性判定模型输出的所述第一识别结果和所述第二识别结果各自的文本合理性判定得分;其中,所述文本合理性用于表示文本数据的表达是否符合语言学规范;
所述文本合理性判定模型为,以标注有文本合理性判定标签的包含符号和/或符号对应的文字的训练文本数据预训练得到;
根据所述第一识别结果和所述第二识别结果的文本合理性判定得分,选取文本合理性高的一个作为最终识别结果输出。
2.根据权利要求1所述的方法,其特征在于,所述分别将所述第一识别结果和所述第二识别结果输入预训练的文本合理性判定模型,得到所述文本合理性判定模型输出的所述第一识别结果和所述第二识别结果各自的文本合理性判定得分,包括:
分别将所述第一识别结果和所述第二识别结果输入预训练的语言合理性判定模型,得到所述语言合理性判定模型输出的所述第一识别结果和所述第二识别结果各自的语言合理性判定得分;
所述语言合理性判定模型为,以标注有语言合理性判定标签的包含符号和/或符号对应的文字的训练文本数据预训练得到。
3.根据权利要求1所述的方法,其特征在于,所述分别将所述第一识别结果和所述第二识别结果输入预训练的文本合理性判定模型,得到所述文本合理性判定模型输出的所述第一识别结果和所述第二识别结果各自的文本合理性判定得分,包括:
获取由所述第一识别结果中,所述目标文字及其前后词组组成的第一三元组;以及,获取由所述第二识别结果中,所述目标符号及其前后词组组成的第二三元组;
分别将所述第一三元组和所述第二三元组输入预训练的语义合理性判定模型,得到所述语义合理性判定模型输出的所述第一三元组和所述第二三元组各自的语义合理性判定得分;
所述语义合理性判定模型为,以训练文本数据中标识词及其前后词组组成的三元组为训练样本,以所述三元组的语义合理性标注结果为样本标签训练得到,所述标识词为符号或符号对应的文字;
将所述第一三元组的语义合理性判定得分作为所述第一识别结果的文本合理性判定得分;将所述第二三元组的语义合理性判定得分作为所述第二识别结果的文本合理性判定得分。
4.根据权利要求2所述的方法,其特征在于,所述分别将所述第一识别结果和所述第二识别结果输入预训练的文本合理性判定模型,得到所述文本合理性判定模型输出的所述第一识别结果和所述第二识别结果各自的文本合理性判定得分,还包括:
获取由所述第一识别结果中,所述目标文字及其前后词组组成的第一三元组;以及,获取由所述第二识别结果中,所述目标符号及其前后词组组成的第二三元组;
分别将所述第一三元组和所述第二三元组输入预训练的语义合理性判定模型,得到所述语义合理性判定模型输出的所述第一三元组和所述第二三元组各自的语义合理性判定得分;
所述语义合理性判定模型为,以训练文本数据中标识词及其前后词组组成的三元组为训练样本,以所述三元组的语义合理性标注结果为样本标签训练得到,所述标识词为符号或符号对应的文字;
根据所述第一识别结果的语言合理性判定得分及所述第一三元组的语义合理性判定得分,确定所述第一识别结果的文本合理性判定得分;
根据所述第二识别结果的语言合理性判定得分及所述第二三元组的语义合理性判定得分,确定所述第二识别结果的文本合理性判定得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810385652.X/1.html,转载请声明来源钻瓜专利网。