[发明专利]一种语音识别方法及装置有效

专利信息
申请号: 201510219286.7 申请日: 2015-04-30
公开(公告)号: CN104821168B 公开(公告)日: 2017-03-29
发明(设计)人: 吕本登 申请(专利权)人: 北京京东方多媒体科技有限公司;京东方科技集团股份有限公司
主分类号: G10L25/51 分类号: G10L25/51;G10L21/0364
代理公司: 北京中博世达专利商标代理有限公司11274 代理人: 申健
地址: 100015 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 识别 方法 装置
【说明书】:

技术领域

发明涉及电子技术领域,尤其涉及一种语音识别方法及装置。

背景技术

语音识别技术是让机器通过识别和理解,把语音信号转变为相应的文本或命令的技术。例如,拥有语音识别功能的手机接收到用户的语音指令后,对该语音指令进行模数转换得到相应的数字信号,进而根据转换后的数字信号识别该语音指令的内容,例如,该语音指令的内容为“解锁”,那么,手机根据该语音指令的内容生成用于解锁的控制信令,以便于对手机进行解锁操作。

然而,在上述语音识别过程中,只能识别接收到的语音指令的内容,但无法确定该语音指令的执行主体,这样就会降低语音识别的准确性,甚至带来不必要的误操作风险,例如,任意用户施加“解锁”指令的语音信号都可以对手机解锁,给用户的信息造成安全隐患。

发明内容

本发明的实施例提供一种语音识别方法及装置,可提高语音识别的准确性。

为达到上述目的,本发明的实施例采用如下技术方案:

第一方面,本发明的实施例提供一种语音识别方法,包括:

接收任意用户发出的第一语音信号;

对所述第一语音信号进行模数转换,生成模数转换后的第一数字信号;

从所述第一数字信号中提取第一语音参数,所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个;

若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1。

结合第一方面,在第一方面的第一种可能的实现方式中,在从所述第一数字信号中提取第一语音参数之后,还包括:

若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符,则将第一语音信号标记为陌生人语音。

结合第一方面,在第一方面的第二种可能的实现方式中,若所述第一语音参数与采样库中的所述第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,包括:

若所述第一语音参数与所述第一预存语音参数的相似度大于阈值,则确定发送所述第一语音信号的用户为所述第一用户;

若所述第一用户具有语音权限,则执行所述第一数字信号所指示的控制信令。

结合第一方面以及第一方面的第一至第二种可能的实现方式中的任一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述从所述第一数字信号中提取第一语音参数,包括:

对所述第一数字信号进行信号过滤,以使得过滤后的第一数字信号中至少包括第一子信号和第二子信号;

从所述第一子信号中提取第二语音参数,并从所述第二子信号中提取第三语音参数。

结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,包括:

从确定所述采样库中是否包括有与所述第二语音参数相符的第二预存语音参数,和/或,与所述第三语音参数相符的第三预存语音参数;

若所述采样库中有与所述第二语音参数相符的第二预存语音参数,则执行所述第一子信号所指示的控制信令;和/或,若所述采样库中有与所述第三语音参数相符的第三预存语音参数,则执行所述第二子信号所指示的控制信令。

结合第一方面,在第一方面的第五种可能的实现方式中,在接收任意用户发出的第一语音信号之前,还包括:

将所述第一预存语音参数和所述第一预存语音参数所对应的第一用户的标识存储至所述采样库,以建立所述第一用户与所述第一预存语音参数的对应关系。

第二方面,本发明提供一种语音识别装置,包括:

接收单元,用于接收任意用户发出的第一语音信号;

采样单元,用于对所述接收单元中的第一语音信号进行模数转换,生成模数转换后的第一数字信号;

提取单元,用于从所述采样单元中的第一数字信号中提取第一语音参数,所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个;

执行单元,用于若所述提取单元中的第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1。

结合第二方方面,在第二方面的第一种可能的实现方式中,所述装置还包括标记单元,用于若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符,则将第一语音信号标记为陌生人语音。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东方多媒体科技有限公司;京东方科技集团股份有限公司,未经北京京东方多媒体科技有限公司;京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510219286.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top