[发明专利]语音识别评估方法、装置、存储介质及设备有效
申请号: | 202010495673.4 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111681642B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 赵立;徐文铭;杨晶生;韩晓 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/26;G06F40/117;G06F40/143 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 评估 方法 装置 存储 介质 设备 | ||
1.一种语音识别评估方法,其特征在于,包括:
基于预设前置处理策略对标注文本和语音识别文本进行处理,得到对应的目标标注文本和目标语音识别文本,其中,所述标注文本和所述语音识别文本对应相同的样本音频数据,所述语音识别文本包括利用预设语音识别方案对所述样本音频数据进行语音识别后输出的识别结果,所述标注文本是基于所述样本音频数据根据人工标注的方式得到的;所述标注文本包括采用预设标注方式进行标注的文本,所述预设标注方式遵循保持语音原义的原则;所述预设标注方式包括以下方式:为预设类型词语添加第一预设符号标注、采用第二预设符号标注模糊字词、以及基于预设的变更规则变更缩写词书写方式;
所述原则体现于以下方面:
避免对重读文字进行纠错、避免对网络用语中的错别字进行纠错、避免对存在缩写的全称读法进行缩写处理、对错误发音进行纠错、按照音频读法对涉及数字的字词进行标注、以及按照音频发音对语气词进行标注;
基于预设对比算法确定所述目标标注文本和所述目标语音识别文本的对比结果;
根据所述对比结果评估所述预设语音识别方案的准确度信息。
2.根据权利要求1所述的方法,其特征在于,所述基于预设前置处理策略对标注文本和语音识别文本进行处理,包括:
基于预设前置处理策略对标注文本和语音识别文本进行针对相同的项目的处理,所述项目包括段落格式、字符占位、文字表达方式以及干扰字符中的至少一个。
3.根据权利要求2所述的方法,其特征在于,基于预设前置处理策略对标注文本和语音识别文本进行针对段落格式的处理包括:
对标注文本和语音识别文本进行多行转单行处理。
4.根据权利要求2所述的方法,其特征在于,基于预设前置处理策略对标注文本和语音识别文本进行针对字符占位的处理包括:
对标注文本和语音识别文本进行全角转半角处理。
5.根据权利要求2所述的方法,其特征在于,基于预设前置处理策略对标注文本和语音识别文本进行针对文字表达方式的处理包括:
对标注文本和语音识别文本进行大写转小写处理、特殊数字书写方式转换处理、词形转换处理和单词切分处理中的至少一项。
6.根据权利要求2所述的方法,其特征在于,基于预设前置处理策略对标注文本和语音识别文本进行针对干扰字符的处理包括:
对标注文本和语音识别文本进行不发音字符滤除处理和/或语气词滤除处理。
7.根据权利要求1-6任一所述的方法,其特征在于,基于预设对比算法确定所述目标标注文本和所述目标语音识别文本的对比结果,包括:
基于最小编辑距离算法确定所述目标标注文本和所述目标语音识别文本对应的编辑路径,并将所述编辑路径作为对比结果;
相应的,所述根据所述对比结果评估所述预设语音识别方案的准确度信息,包括:
根据所述编辑路径确定所述预设语音识别方案的字错率或词错率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010495673.4/1.html,转载请声明来源钻瓜专利网。