[发明专利]用于语音识别的方法、语音识别装置和电子设备有效
申请号: | 201410013478.8 | 申请日: | 2014-01-13 |
公开(公告)号: | CN103700368B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 王伟宁;戴海生;宫玉强 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L15/065 | 分类号: | G10L15/065 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 安之斐 |
地址: | 100085*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 识别 方法 装置 电子设备 | ||
技术领域
本发明涉及信息技术领域,更具体地,涉及一种用于语音识别的方法、语音识别装置和电子设备。
背景技术
语音识别技术是通过识别和理解而将语音转变为相应的文本或命令的技术。在语音识别技术中,通过对语音进行特征提取、模式匹配、模型训练等处理,而获得电子设备能够响应的指令、在电子设备中记录的文本等,从而用户能够利用语言来与电子设备进行交互。
在真实的语音环境中通常存在噪音,而且真实的口语中会参杂停顿、咳嗽声等干扰音,这都影响现有的语音识别系统的识别准确度。另外,如果用户说的词汇不在语音识别系统预先设定的领域范围内,也较容易造成识别错误。因此,对于商业化的语音识别系统,期望拒绝错误的语音。相应地,置信度评价被用于确保所识别的内容的准确性,并拒绝被错误识别的语音。
置信度评价可以对语音识别装置的识别结果进行假设检验,通过事先设定的置信度阈值对识别结果的可靠性进行评价,定位结果中的错误,从而提高识别系统的识别率和稳健性。因此,合理地设置置信度阈值是非常关键的,这已经成为当前的技术难题。
发明内容
本发明实施例提供了一种用于语音识别的方法、语音识别装置和电子设备,其使得能够在不同的情况下采用不同的置信度阈值以兼顾语音识别的识别率和稳健性,从而提高了用户的使用体验。
第一方面,提供了一种用于语音识别的方法,应用于一包括第一语音识别装置的电子设备,所述方法可包括:接收一语音输入,并获得与该语音输入对应的音频信号;利用所述第一语音识别装置对所述音频信号进行识别处理而得到一识别结果,该识别结果包括识别内容和置信度,该置信度用于确定该识别内容的可靠程度;预先设置至少两个置信度阈值,各个置信度阈值彼此不同;从所述至少两个置信度阈值中选择一置信度阈值;基于所述识别结果中的置信度和所述选择的置信度阈值来判断所述识别内容是否准确。
在所述用于语音识别的方法中,所述预先设置至少两个置信度阈值可包括:根据所述第一语音识别装置能够识别的识别内容和其网络状况中的至少一个来预先设置至少两个置信度阈值。
在所述用于语音识别的方法中,所述第一语音识别装置能够识别的内容可包括多个命令词,所述根据所述第一语音识别装置能够识别的识别内容和其网络状况中的至少一个来预先设置至少两个置信度阈值可包括:针对所述多个命令词中的第一命令词设置第一置信度阈值;针对所述多个命令词中的第二命令词设置第二置信度阈值,该第二命令词不同于所述第一命令词。
在所述用于语音识别的方法中,根据所述第一语音识别装置能够识别的识别内容和其网络状况中的至少一个来预先设置至少两个置信度阈值可包括:针对所述第一语音识别装置具有网络连接的情况而设置第三置信度阈值;针对所述第一语音识别装置不具有网络连接的情况而设置第四置信度阈值。
在所述用于语音识别的方法中,所述从所述至少两个置信度阈值中选择一置信度阈值可包括:确定所述识别结果中的识别内容是否对应于所述第二命令词;当所述识别内容对应于所述第二命令词时,选择第二置信度阈值;当所述识别内容不对应于所述第二命令词时,确定所述第一语音识别装置是否具有网络连接;当所述第一语音识别装置具有网络连接时,选择第三置信度阈值;当所述第一语音识别装置不具有网络连接时,选择第四置信度阈值。
在所述用于语音识别的方法中,所述基于所述识别结果中的置信度和所述选择的置信度阈值来判断所述识别内容是否准确可包括:将所述识别结果中的置信度与所选择的第二置信度阈值或所选择的第三置信度阈值相比较,而得到一比较结果;根据所述比较结果判断所述识别内容是否准确。
在所述用于语音识别的方法中,还可包括:当判断所述识别内容不准确时,将所述音频信号传送到与所述电子设备网络连接的第二语音识别装置,该第二语音识别装置能够对所述音频信号进行识别处理而获得第二识别内容;从所述第二语音识别装置接收所述第二识别内容,并将该第二识别内容作为最终的识别内容。
在所述用于语音识别的方法中,还可包括:将所述音频信号传送到与所述电子设备网络连接的第二语音识别装置,该第二语音识别装置能够对所述音频信号进行识别处理而获得第二识别内容;当在所述判断操作中判断所述识别内容不准确时,在一预设时间段中从所述第二语音识别装置接收所述第二识别内容。
在所述用于语音识别的方法中,还可包括:当在所述预设时间段中未接收到所述第二识别内容时,获得小于所选择的置信度阈值的一低置信度阈值;和基于该低置信度阈值判断所述识别内容是否准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410013478.8/2.html,转载请声明来源钻瓜专利网。