[发明专利]一种语音识别方法、装置、电子设备、系统和介质在审
申请号: | 202210350012.1 | 申请日: | 2022-04-02 |
公开(公告)号: | CN114694653A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 胡玉祥;朱长宝;余凯 | 申请(专利权)人: | 深圳地平线机器人科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/10;G10L15/26;G10L15/183 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 李少丹;许伟群 |
地址: | 518052 广东省深圳市南山区粤海街道高新区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 电子设备 系统 介质 | ||
公开了一种语音识别方法、装置、电子设备、系统和介质,该方法包括:响应于歌曲播放指令,获取歌曲对应的歌词信息;基于麦克风阵列获取语音信号,基于所述语音信号检测唤醒词;确定所述唤醒词与所述歌词信息的第一相似度分值;当所述唤醒词与歌词信息的第一相似度分值大于等于第一阈值,确定所述唤醒词的第一检测类型为无效,不响应该唤醒词;若小于所述第一阈值,则获取包含该唤醒词的唤醒语句;基于所述唤醒语句和歌词信息的第二相似度分值确定当该唤醒词的第二检测类型为无效时,不响应所述唤醒词。本方法能有效防止在听歌或者唱歌的时候智能语音系统被误唤醒,保持用户听歌或者唱歌的流畅性,提升了用户体验。
技术领域
本公开涉及语音识别领域,尤其是涉及一种语音识别方法、装置、电子设备、系统和计算机可读存储介质。
背景技术
随着科学技术的不断发展,以及人们追求生活品质的不断提高,越来越多的设备具有语音控制功能,比如汽车、家用电器、智能家居等。其中,一种场景是用户在听歌或者唱歌时,如果播放的歌曲或者演唱的歌曲的歌词内容与智能语音系统中预设的唤醒词相同或相近似时,有概率会误唤醒智能语音系统。如歌词内容包括“下一首”或者“下一个”时,智能语音系统有概率会被触发唤醒,响应当前唤醒词,导致切歌或播放下一首歌曲,进而影响了用户体验。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种语音识别方法、装置、电子设备、系统和介质。
根据本公开实施例的一个方面,提供一种语音识别方法,方法包括:
响应于歌曲播放指令,获取歌曲对应的歌词信息;
基于麦克风阵列获取语音信号,基于所述语音信号检测唤醒词;
确定所述唤醒词与所述歌词信息的第一相似度分值;
基于所述第一相似度分值大于等于第一阈值,确定所述唤醒词的第一检测类型为无效,不响应所述唤醒词;
基于所述第一相似度分值小于所述第一阈值,获取包含所述唤醒词的唤醒语句;
基于所述唤醒语句和所述歌词信息的第二相似度分值,确定所述唤醒词的第二检测类型;
基于所述唤醒词的第二检测类型为无效,不响应所述唤醒词;
基于所述唤醒词的第二检测类型为有效,响应所述唤醒词。
根据本公开实施例的另一个方面,提供了一种语音识别装置,该装置包括:
歌词获取模块,用于响应于歌曲播放指令,获取歌曲对应的歌词信息;
语音获取模块,用于基于麦克风阵列获取语音信号;
语音检测模块,用于基于所述语音获取模块获取的所述语音信号检测唤醒词,确定所述唤醒词与所述歌词获取模块获取的所述歌词信息的第一相似度分值,以及,基于所述第一相似度分值大于等于第一阈值,确定所述唤醒词的第一检测类型为无效;基于所述第一相似度分值小于所述第一阈值,获取包含所述唤醒词的唤醒语句,基于所述唤醒语句和所述歌词信息的第二相似度分值,确定所述唤醒词的第二检测类型为无效;
语音处理模块,用于基于所述语音检测模块确定的所述唤醒词的第一检测类型为无效,或,所述唤醒词的第二检测类型为无效,不响应所述唤醒词,以及基于确定的所述唤醒词的第二检测类型为有效,响应所述唤醒词。
根据本公开实施例的另一个方面,提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
处理器,用于从存储器中读取可执行指令,并执行该指令以实现上述语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳地平线机器人科技有限公司,未经深圳地平线机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210350012.1/2.html,转载请声明来源钻瓜专利网。