[发明专利]一种语音控制方法、装置、设备及存储介质有效
申请号: | 201910101100.6 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109754788B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 唐丹丹 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/22;G10L15/26 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 控制 方法 装置 设备 存储 介质 | ||
本发明实施例提出一种语音控制方法、装置、设备及存储介质,其中方法包括:检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;针对所述文本信息执行对应的操作。本发明实施例能够简化与语音交互设备的交互流程,提高用户体验。
技术领域
本发明涉及语音交互技术领域,尤其涉及一种语音控制方法、装置、设备及存储介质。
背景技术
现有的语音交互技术中,用户在使用语音交互设备时,需要首先说出固定的唤醒词来唤醒设备,等待设备播报唤醒成功的提示后,再说出包含需求的语音指令。
例如,某语音交互设备的唤醒词为“小A小A”。当用户需要语音交互设备播放音乐时,首先说出“小A小A”,等待语音交互设备播放“我来了”的语音信息。之后,用户再说出“我要听音乐”,语音交互设备对接收的语音信息进行语音识别,得到对应的文本信息,并针对该文本信息执行相应的操作。
可见,现有的语音交互方式中,用户每发出一次指令都需要两轮交互。并且,用户需要掌握唤醒词并了解语音交互设备何时被唤醒成功,在等待唤醒成功的提示之后再说出相应的指令。这种方式费时费力,导致用户体验较差。
发明内容
本发明实施例提供一种语音控制方法及装置,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种语音控制方法,包括:
检测语音信息的前多个音节中是否包含唤醒关键词;
如果包含,则对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;
针对所述文本信息执行对应的操作。
在一种实施方式中,所述检测语音信息的前多个音节中是否包含唤醒关键词,包括:
采用预先设置的针对多个唤醒关键词的语音唤醒模型,检测所述语音信息的前多个音节中是否包含所述多个唤醒关键词中的任意一个唤醒关键词,如果是,则判定所述语音信息的前多个音节中包含唤醒关键词。
在一种实施方式中,所述针对所述文本信息执行相应的处理,包括:
判断所述文本信息是否为指令信息;
如果是,则针对所述文本信息执行对应的操作。
在一种实施方式中,所述判断所述文本信息是否为指令信息,包括:
根据预设的唤醒关键词与指令判断策略的对应关系,获取所述语音信息中包含的唤醒关键词所对应的指令判断策略;
采用获取的指令判断策略判断所述文本信息是否为指令信息。
在一种实施方式中,所述语音唤醒模型设置于本地装置。
在一种实施方式中,所述对所述语音信息进行语音识别,包括:采用设置于本地装置的语音识别模型对所述语音信息进行语音识别;或者,将所述语音信息发送至云端服务器,采用设置于云端服务器的语音识别模型对所述语音信息进行语音识别。
第二方面,本发明实施例还提出一种语音控制装置,包括:
检测模块,用于检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则指示识别模块进行识别;
所述识别模块,用于根据所述检测模块的指示,对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;
操作模块,用于针对所述文本信息执行对应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910101100.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法及移动终端
- 下一篇:语音音素的识别方法及装置