[发明专利]一种语音唤醒方法、装置及系统在审

申请号：	201510702094.1	申请日：	2015-10-26
公开（公告）号：	CN105654943A	公开（公告）日：	2016-06-08
发明（设计）人：	王育军	申请（专利权）人：	乐视致新电子科技（天津）有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/14;G10L15/26
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	黄志华
地址：	300467 天津市滨海新区生态城***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音唤醒方法装置系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音唤醒方法，其特征在于，包括：

对获取的当前输入语音进行语音特征提取；

根据提取到的语音特征，按照预先构建的关键词检测模型，确定所述当前输入语音中是否存在指令词，所述关键词检测模型中的关键词至少包括预设的指令词；

当所述当前输入语音中存在指令词时，唤醒语音识别器，并根据指令词执行指令词指示的相应操作。

2.根据权利要求1所述的方法，其特征在于，在根据指令词执行指令词指示的相应操作之前，还包括：

获取对所述当前输入语音的语义与指令语义进行匹配的匹配成功消息，所述匹配成功消息为所述语音识别器对所述输入语音进行语义解析，得到所述当前输入语音的语义，并对所述当前输入语音的语义与设定的指令语义进行匹配成功后发送的。

3.根据权利要求1所述的方法，其特征在于，构建关键词检测模型，具体包括：

针对语音中的每一个音素，在语料库中提取每个音素对应的声学参数样本，所述语料库是用于保存语音文本和所述语音文本对应的语音的；

按照预设的训练算法，对每一个音素对应的声学参数样本进行训练，得到声学模型，所述声学模型为音素与对应的声学参数的对应关系；

在发音词典中查找关键词对应的关键词音素，并将声学模型中关键词音素与对应的声学参数构建为关键词检测模型，所述发音词典是用于保存词组包括的音素的。

4.根据权利要求1所述的方法，其特征在于，构建关键词检测模型，具体包括：

在发音词典中查找关键词对应的关键词音素，所述发音词典是用于保存词组包括的音素的；

在语料库中提取所述关键词音素对应的声学参数样本，所述语料库是用于保存语音文本对应的语音的；

按照预设的训练算法，对所述关键词音素对应的声学参数样本进行训练，得到关键词检测模型。

5.根据权利要求1所述的方法，其特征在于，所述关键词检测模型为隐马尔科夫链模型；

根据提取到的语音特征，按照预先构建的关键词检测模型，确定所述输入语音中是否存在指令词，具体包括：

采用声学模型评估，对提取到的语音特征，在隐马尔科夫模型中的每一条隐马尔科夫链上进行指令词确认，得到该隐马尔科夫链的指令词确认分数；

确认与所述指令词确认分数最高的隐马尔科夫链对应的词组是否为预设的指令词。

6.根据权利要求1所述的方法，其特征在于，所述关键词检测模型中的关键词还包括预设的唤醒词；

所述方法，还包括：

当根据提取到的语音特征，按照预先构建的关键词检测模型，确定所述输入语音中存在唤醒词时，唤醒语音识别器。

7.一种语音唤醒装置，其特征在于，包括：

提取单元，用于对获取的当前输入语音进行语音特征提取；

指令词确定单元，用于根据提取到的语音特征，按照预先构建的关键词检测模型，确定所述当前输入语音中是否存在指令词，所述关键词检测模型中的关键词至少包括预设的指令词；

第一唤醒单元，用于当所述当前输入语音中存在指令词时，唤醒语音识别器，并根据指令词执行指令词指示的相应操作。

8.根据权利要求7所述的装置，其特征在于，还包括：

获取单元，用于获取对所述当前输入语音的语义与指令语义进行匹配的匹配成功消息，所述匹配成功消息为所述语音识别器对所述输入语音进行语义解析，得到所述当前输入语音的语义，并对所述当前输入语音的语义与设定的指令语义进行匹配成功后发送的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于乐视致新电子科技（天津）有限公司，未经乐视致新电子科技（天津）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510702094.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载