[发明专利]一种语音唤醒方法、装置及系统在审
申请号: | 201510702094.1 | 申请日: | 2015-10-26 |
公开(公告)号: | CN105654943A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 王育军 | 申请(专利权)人: | 乐视致新电子科技(天津)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/14;G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 300467 天津市滨海新区生态城*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 唤醒 方法 装置 系统 | ||
1.一种语音唤醒方法,其特征在于,包括:
对获取的当前输入语音进行语音特征提取;
根据提取到的语音特征,按照预先构建的关键词检测模型,确定所述当 前输入语音中是否存在指令词,所述关键词检测模型中的关键词至少包括预 设的指令词;
当所述当前输入语音中存在指令词时,唤醒语音识别器,并根据指令词 执行指令词指示的相应操作。
2.根据权利要求1所述的方法,其特征在于,在根据指令词执行指令词 指示的相应操作之前,还包括:
获取对所述当前输入语音的语义与指令语义进行匹配的匹配成功消息, 所述匹配成功消息为所述语音识别器对所述输入语音进行语义解析,得到所 述当前输入语音的语义,并对所述当前输入语音的语义与设定的指令语义进 行匹配成功后发送的。
3.根据权利要求1所述的方法,其特征在于,构建关键词检测模型,具 体包括:
针对语音中的每一个音素,在语料库中提取每个音素对应的声学参数样 本,所述语料库是用于保存语音文本和所述语音文本对应的语音的;
按照预设的训练算法,对每一个音素对应的声学参数样本进行训练,得 到声学模型,所述声学模型为音素与对应的声学参数的对应关系;
在发音词典中查找关键词对应的关键词音素,并将声学模型中关键词音 素与对应的声学参数构建为关键词检测模型,所述发音词典是用于保存词组 包括的音素的。
4.根据权利要求1所述的方法,其特征在于,构建关键词检测模型,具 体包括:
在发音词典中查找关键词对应的关键词音素,所述发音词典是用于保存 词组包括的音素的;
在语料库中提取所述关键词音素对应的声学参数样本,所述语料库是用 于保存语音文本对应的语音的;
按照预设的训练算法,对所述关键词音素对应的声学参数样本进行训练, 得到关键词检测模型。
5.根据权利要求1所述的方法,其特征在于,所述关键词检测模型为隐 马尔科夫链模型;
根据提取到的语音特征,按照预先构建的关键词检测模型,确定所述输 入语音中是否存在指令词,具体包括:
采用声学模型评估,对提取到的语音特征,在隐马尔科夫模型中的每一 条隐马尔科夫链上进行指令词确认,得到该隐马尔科夫链的指令词确认分数;
确认与所述指令词确认分数最高的隐马尔科夫链对应的词组是否为预设 的指令词。
6.根据权利要求1所述的方法,其特征在于,所述关键词检测模型中的 关键词还包括预设的唤醒词;
所述方法,还包括:
当根据提取到的语音特征,按照预先构建的关键词检测模型,确定所述 输入语音中存在唤醒词时,唤醒语音识别器。
7.一种语音唤醒装置,其特征在于,包括:
提取单元,用于对获取的当前输入语音进行语音特征提取;
指令词确定单元,用于根据提取到的语音特征,按照预先构建的关键词 检测模型,确定所述当前输入语音中是否存在指令词,所述关键词检测模型 中的关键词至少包括预设的指令词;
第一唤醒单元,用于当所述当前输入语音中存在指令词时,唤醒语音识 别器,并根据指令词执行指令词指示的相应操作。
8.根据权利要求7所述的装置,其特征在于,还包括:
获取单元,用于获取对所述当前输入语音的语义与指令语义进行匹配的 匹配成功消息,所述匹配成功消息为所述语音识别器对所述输入语音进行语 义解析,得到所述当前输入语音的语义,并对所述当前输入语音的语义与设 定的指令语义进行匹配成功后发送的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐视致新电子科技(天津)有限公司,未经乐视致新电子科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510702094.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通用多功能语音信号适配器
- 下一篇:一种屏幕背光控制电路及显示装置