[发明专利]一种基于三元组的语音识别准确率计算方法有效
申请号: | 202110026253.6 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112349290B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 杜沪;邵志明;宋琼;李科;郝玉峰;黄宇凯 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/69;G06F16/35;G06F40/205;G06F40/279;G06F40/30;G06N3/04 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三元 语音 识别 准确率 计算方法 | ||
本公开是关于一种基于三元组的语音识别准确率计算方法及装置、电子设备和计算机可读存储介质。其中,方法包括:获取待识别语音及语音对应的正确文本;识别语音,得到识别文本;标注识别文本及正确文本;解析标注的识别文本及正确文本,获得识别文本的三元组序列及正确文本的三元组序列;根据识别文本的三元组序列及正确文本的三元组序列计算识别准确率。一方面,对文本进行标注,可以有效划分出会影响语音识别准确率的词语;另一方面,将语音识别结果与正确答案统一转化为三元组形式,进一步丰富词语的语义信息,减少因识别引擎识别结果格式的不同导致准确率统计上的偏差,从而对语音识别引擎的改进提供质量控制依据。
技术领域
本公开涉及数据处理领域,尤其涉及一种基于三元组的语音识别准确率计算方法及装置、电子设备和计算机可读存储介质。
背景技术
目前,伴随着语音识别技术的不断发展,基于语音识别的应用也越来越广泛,已经逐步渗透入家庭生活、办公领域、娱乐等方面。用户通过利用对着个人计算机、笔记本电脑、平板电脑、专用的学习终端、智能手机等终端上外接或内置的麦克风来输入语音(例如,朗读一句话),经由语音识别引擎(以下简称“引擎”)完成语音-文字的转换。对于语音识别引擎,大众普遍关心其识别准确率,即识别出的文字是否与对应的语音正确的文字相符。语音识别准确率可以有效衡量语音识别引擎的语音-文字的转换效果,客观有效的指标可以帮助开发者改进语音识别算法,提升使用体验。
目前已知的识别准确率计算方式都是使用词错误率WER(Word Error Rate),即计算正确答案和识别结果之间文本层面的编辑距离。然而,计算正确答案和识别结果之间文本层面的编辑距离的方法,并未充分考虑识别引擎对同一个语义的多种表达形式。例如:
正确答案:2020-11-23
识别结果:2020/11/23
很明显,以上两个字符串均表示相同的年月日,但是WER计算时,却认为识别结果是错误的。因此,更准确的衡量方式应该是基于语义层面的比较,即把上述例子中不同展现形式的、但代表同样语义的信息应视为相同的结果,做衡量并计算准确度。为了达到有效评价语音识别引擎效果的目的,开发有效的语音识别评价方法是不可或缺的。
发明内容
为克服相关技术中存在的问题,本公开提供一种基于三元组的语音识别准确率计算方法及装置、电子设备和计算机可读存储介质。
根据本公开实施例的第一方面,提供一种基于三元组的语音识别准确率计算方法,方法包括:获取待识别语音及语音对应的正确文本;识别语音,得到识别文本;标注识别文本及正确文本;解析标注的识别文本及正确文本,获得识别文本的三元组序列及正确文本的三元组序列;根据识别文本的三元组序列及正确文本的三元组序列计算识别准确率。
在一实施例中,通过三元组分类模型,标注识别文本及正确文本,其中,三元组分类模型通过以下训练方式得到:设定三元组分类模型的类别;根据三元组分类模型的类别特点,收集相应的训练文本;对训练文本进行分词,标注每个词语的三元组类别,得到训练集;根据训练集训练三元组分类模型。
在一实施例中,三元组分类模型是BiLSTM-CRF模型。
在一实施例中,解析标注的识别文本及正确文本,获得识别文本的三元组序列及正确文本的三元组序列,包括:获取当前词语的标注类型;根据标注类型,划分当前词语为一个或者多个词语单元,词语单元包括单元类型及词语值;计算词语单元的权重,得到词语单元的三元组,三元组包括词语单元的单元类型,词语值及权重;将标注的识别文本及正确文本的所有词语转换为三元组。
在一实施例中,根据标注类型,划分当前词语为一个或者多个词语单元,包括:根据标注类型,设置对应的词语单元,每个标注类型可包括一个或多个词语单元;通过正则表达式构建词语单元划分规则;根据词语单元划分规则,将词语划分为词语单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司,未经北京海天瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110026253.6/2.html,转载请声明来源钻瓜专利网。