[发明专利]关键词检测方法和装置、计算机可读存储介质、电子设备在审
申请号: | 201910510516.3 | 申请日: | 2019-06-13 |
公开(公告)号: | CN112185367A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 黄明运;刘鼎;潘复平;王振兴 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/28;G10L15/02 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 王晓多 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 检测 方法 装置 计算机 可读 存储 介质 电子设备 | ||
公开了一种关键词检测方法和装置、计算机可读存储介质和电子设备,其中,方法包括:对音频信息进行语音识别处理,得到音频信息的至少一个候选关键词;针对至少一个候选关键词的每一候选关键词,确定每一候选关键词对应的两个以上置信度;基于每一候选关键词对应的两个以上置信度,确定每一候选关键词对应的综合置信度;根据每一候选关键词的综合置信度,确定音频信息的目标关键词,当以该目标关键词进行语音唤醒时,由于是基于综合置信度确定的目标关键词,并且综合置信度体现了多个置信度的特点,因此可以实现在提升关键词的识别率的同时,有效降低关键词的误报率,同时兼顾关键词的识别率和误报率,从而获得较好的语音唤醒效果。
技术领域
本公开涉及语音技术,尤其是一种关键词检测方法和装置、计算机可读存储介质、电子设备。
背景技术
随着人工智能的普及,语音已成为了重要的交互方式。语音唤醒是在连续语流中实时检测出说话人特定片段的技术。语音唤醒的应用领域非常广泛,例如:机器人、手机、可穿戴设备、智能家居、车载设备等,在很多带有语音功能的设备上,大都会需要语音唤醒技术作为人和机器互动的一个开始或入口。
发明内容
在实现本发明的过程中,本发明人通过研究发现,在从音频信息中检测出关键词进行语音唤醒时,如果把识别率调整到比较高的水平,误报数也比较高,不能得到很好的语音唤醒效果。
为了解决上述技术问题,本公开实施例提供了一种关键词检测方法和装置、计算机可读存储介质、电子设备。
根据本公开实施例的一个方面,提供了一种关键词检测方法,包括:
对音频信息进行语音识别处理,得到所述音频信息的至少一个候选关键词;
针对所述至少一个候选关键词的每一候选关键词,确定所述每一候选关键词对应的两个以上置信度;
基于所述每一候选关键词对应的两个以上置信度,确定所述每一候选关键词对应的综合置信度;
根据所述每一候选关键词的综合置信度,确定所述音频信息的目标关键词。
根据本公开实施例的另一个方面,提供了一种关键词检测装置,包括:
识别模块,用于对音频信息进行语音识别处理,得到所述音频信息的至少一个候选关键词;
第一计算模块,用于针对所述识别模块确定的至少一个候选关键词的每一候选关键词,确定所述每一候选关键词对应的两个以上置信度;
第二计算模块,用于基于所述第一计算模块确定的每一候选关键词对应的两个以上置信度,确定所述每一候选关键词对应的综合置信度;
处理模块,用于根据所述第二计算模块得到的所述每一候选关键词的综合置信度,确定所述音频信息的目标关键词。
根据本公开实施例的又一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一实施例所述的方法。
根据本公开实施例的还一个方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述任一实施例所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910510516.3/2.html,转载请声明来源钻瓜专利网。