[发明专利]声纹识别方法、装置及存储装置在审
申请号: | 201810969451.4 | 申请日: | 2018-08-23 |
公开(公告)号: | CN110895941A | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 熊友军;李浩明;夏严辉;李利阳;温品秀 | 申请(专利权)人: | 深圳市优必选科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/00 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 钟子敏 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 方法 装置 存储 | ||
本申请公开了一种声纹识别方法、装置及存储装置,该方法包括:获取当前语音数据中的第一声纹特征;判断所述第一声纹特征是否和所述声纹库中的所述声纹特征匹配;若匹配,则提取所述当前语音数据的第一人声数据进行语音识别。通过上述方式,本申请能够提高后续语音识别的准确率及信噪比。
技术领域
本申请涉及智能机器人技术领域,特别是涉及一种声纹识别方法、装置及存储装置。
背景技术
随着人们生活水平的提高以及机器人技术的进步,机器人已经逐步走入了普通家庭的视野,如市面上常见的除草机器人、清洁机器人及管家机器人等。随着语音识别技术的发展与普及,现在市面上许多机器人都具备了语音识别及语义识别功能,用户可以通过直接与机器人语音对话的形式,来与机器人进行交互,控制机器人工作。
目前的语音识别技术能做到安静的环境之下,较好的接收和识别用户语音指令,与用户进行交互,但一旦环境中出现了噪声时(例如应用在说话人较多的空间,或者所应用的空间的背景噪声较强),由于背景噪声与说话人的语音指令糅合在一起,会使语音识别更为困难,识别准确度大大降低。
发明内容
本申请提供一种声纹识别方法、装置及存储装置,能够解决现有技术中语音识别中其准确率不高的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种声纹识别方法,所述方法包括:获取当前语音数据中的第一声纹特征;判断所述第一声纹特征是否和所述声纹库中的所述声纹特征匹配;若匹配,则提取所述当前语音数据的第一人声数据进行语音识别。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种声纹识别装置,所述装置包括处理器及存储器,所述处理器连接所述存储器;其中,所述处理器用于获取当前语音数据中的第一声纹特征;判断所述第一声纹特征是否和所述声纹库中的所述声纹特征匹配;若匹配,则提取所述当前语音数据的第一人声数据进行语音识别。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种存储装置,存储有能够实现上述任一项所述方法的程序文件。
本申请的有益效果是:提供一种声纹识别方法、装置及存储装置,通过将获取到当前语音数据中的第一声纹特征和预设声纹库中的声纹特征进行比对匹配,可以提高后续语音识别的准确率及信噪比。
附图说明
图1是本申请声纹识别方法一实施方式的流程示意图;
图2是本申请步骤S1一实施方式的流程示意图;
图3是本申请步骤S2一实施方式的流程示意图;
图4是本申请声纹识别装置一实施方式的结构示意图;
图5是本申请存储装置一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技有限公司,未经深圳市优必选科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810969451.4/2.html,转载请声明来源钻瓜专利网。