[发明专利]语音识别结果的检测方法、装置、设备及介质有效
申请号: | 201910907336.9 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110556127B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 赵鑫;苏少炜;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/63;G10L15/22 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 滕一斌 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 结果 检测 方法 装置 设备 介质 | ||
本发明公开了一种语音识别结果的检测方法、装置、设备及介质,属于网络技术领域。本发明通过获取同一用户设备相邻且时间间隔小于一定值的两个语音指令以及各自的语音识别结果,获取该两个语音指令的语音识别结果的相似度,根据该相似度确定该两个语音指令中前一条语音指令的语音识别结果是否存在错误。该语音识别结果的检测方法自动检测确定存在错误的语音识别结果,不需要人工对全部的语音指令以及语音识别结果进行检测,提高了确定语音识别错误的效率。
技术领域
本发明涉及网络技术领域,特别涉及一种语音识别结果的检测方法、装置、设备及介质。
背景技术
近年来,智能音箱等智能语音设备作为家庭场景中有效的人机交互入口,受到广泛关注,这些智能语音设备在使用过程中接收用户的语音指令,通过多项复杂技术对语音指令进行处理,实现人机交互。自动语音识别(Automatic Speech Recognition,ASR)是识别语音指令,将语音信息识别为文本信息的技术,在处理语音指令过程中有重要作用。我们通常会在语音识别后确定语音识别结果是否存在错误,从而使用这些识别错误的语音识别结果来优化ASR的模型,提高语音识别的准确率。
目前,语音识别结果的检测方法通常是构建一个包含多条语音指令的语料库,由人工标注语料库中每条语音指令对应的文字,通过对比当前语音指令的语音识别结果和人工标注的结果,从而确定语音识别结果是否存在错误。
在上述方法中,人工标注的工作量很大,而且随着ASR识别效果的不断提升,语音识别结果存在错误的几率越来越小,同等人力条件下,确定语音识别结果的检测效率不断降低,导致大量的人力资源浪费。
发明内容
本发明实施例提供了一种语音识别结果的检测方法、装置、设备及介质,可以解决相关技术中确定语音识别结果的检测效率低的问题。所述技术方案如下:
一方面,提供了一种语音识别结果的检测方法,该方法包括:
获取语音指令信息,该语音指令信息包括同一用户设备接收到的两个语音指令以及各自的语音识别结果,该两个语音指令包括第一语音指令和第二语音指令,该第二语音指令为该第一语音指令的前一条语音指令;
当该两个语音指令的接收时间间隔小于时间间隔阈值时,根据该语音指令信息,获取该两个语音指令的语音识别结果的相似度;
当该相似度符合相似度条件时,确定该第二语音指令的语音识别结果存在错误。
在一种可能实现方式中,该当该两个语音指令的接收时间间隔小于时间间隔阈值时,根据该语音指令信息,获取该两个语音指令的语音识别结果的相似度,包括:
当该两个语音指令的接收时间间隔小于时间间隔阈值时,根据该语音指令信息,获取该两个语音指令的语义差异或信号差异中至少一项;
当该语义差异或信号差异中至少一项符合错误条件时,执行获取该相似度的步骤。
在一种可能实现方式中,该语义差异或信号差异中至少一项包括多项比较结果;
该根据该语音指令信息,获取该两个语音指令的语义差异或信号差异中至少一项,包括:
根据该语音指令信息,获取该两个语音指令的第一比较结果;
当该第一比较结果符合该错误条件时,获取该两个语音指令的第二比较结果。
在一种可能实现方式中,该语义差异包括该两个语音指令的语义解析结果所属的领域关系,该信号差异包括该两个语音指令的音调比较结果、情绪比较结果或声纹比较结果中至少一项;
该语义差异或信号差异中至少一项符合错误条件,包括下述至少一项:
该两个语音指令的语义解析结果所属的领域不同,或该两个语音指令的语义解析结果所属的领域均为目标领域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910907336.9/2.html,转载请声明来源钻瓜专利网。