[发明专利]电子装置、基于声纹的身份验证方法及存储介质在审
申请号: | 201711161344.0 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107993071A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 赵峰;王健宗;程宁;郑斯奇;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G10L17/08;G10L17/18;G10L25/24 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙)44347 | 代理人: | 高杰,于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 装置 基于 声纹 身份验证 方法 存储 介质 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种电子装置、基于声纹的身份验证方法及存储介质。
背景技术
目前,很多大型金融公司的业务范围涉及保险、银行、投资等多个业务范畴,而每个业务范畴通常都需要同客户进行沟通,因此,对客户的身份验证也就成为保证业务安全的重要组成部分。为了满足业务的实时性需求,目前这类金融公司通常采用人工方式对客户的身份进行分析验证,但是由于客户群体庞大,单一依靠人工进行判别分析不仅费时费力、容易出错,而且也会极大地增加业务成本;另外,有些金融公司尝试采用语音自动识别的方式自动对用户的身份进行鉴别,然而,这类现有的语音自动识别方式的准确率低,有待改进。因此,如何提供准确性高的语音自动识别方案已经成为一个亟待解决的技术问题。
发明内容
本发明的目的在于提供一种电子装置、基于声纹的身份验证方法及存储介质,旨在提高身份验证的准确性及效率。
为实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
分帧采样步骤,在接收到待进行身份验证的目标用户的语音数据后,调用预定的卷积神经网络CNN模型对该语音数据进行分帧和采样,得到语音采样数据;
提取步骤,利用预设滤波器对该语音采样数据进行处理以提取预设类型声纹特征,并基于该预设类型声纹特征构建所述语音数据对应的声纹特征向量;
构建步骤,将该声纹特征向量输入预先训练的背景信道模型,以构建出所述语音数据的当前声纹鉴别向量;
验证步骤,计算该当前声纹鉴别向量与预存的该目标用户的标准声纹鉴别向量之间的空间距离,基于该空间距离对该用户进行身份验证,并生成验证结果。
优选地,所述分帧采样步骤,具体包括:
对该语音数据进行分帧,将分帧后的语音数据以帧为行,以帧内数据为列,得到该语音数据对应的二维语音数据;
采用预设规格的卷积核,并基于第一预设步长,对该二维语音数据进行卷积;
对卷积后的语音数据按照第二预设步长进行最大池化maxpooling采样,得到所述语音采样数据。
优选地,所述提取步骤,具体包括:
对所述语音采样数据进行预加重及加窗处理,对每一个加窗进行傅立叶变换得到对应的频谱,将所述频谱输入梅尔滤波器以输出得到梅尔频谱;
在梅尔频谱上进行倒谱分析以获得梅尔频率倒谱系数MFCC,基于所述梅尔频率倒谱系数MFCC组成对应的声纹特征向量。
优选地,所述验证步骤,具体包括:
计算该当前声纹鉴别向量与预存的该目标用户的标准声纹鉴别向量之间的余弦距离:为所述标准声纹鉴别向量,为当前声纹鉴别向量;
若所述余弦距离小于或者等于预设的距离阈值,则生成验证通过的信息;
若所述余弦距离大于预设的距离阈值,则生成验证不通过的信息。
为实现上述目的,本发明还提供一种基于声纹的身份验证方法,所述基于声纹的身份验证方法包括:
S1,在接收到待进行身份验证的目标用户的语音数据后,调用预定的卷积神经网络CNN模型对该语音数据进行分帧和采样,得到语音采样数据;
S2,利用预设滤波器对该语音采样数据进行处理以提取预设类型声纹特征,并基于该预设类型声纹特征构建所述语音数据对应的声纹特征向量;
S3,将该声纹特征向量输入预先训练的背景信道模型,以构建出所述语音数据的当前声纹鉴别向量;
S4,计算该当前声纹鉴别向量与预存的该目标用户的标准声纹鉴别向量之间的空间距离,基于该空间距离对该用户进行身份验证,并生成验证结果。
优选地,所述步骤S1包括:
对该语音数据进行分帧,将分帧后的语音数据以帧为行,以帧内数据为列,得到该语音数据对应的二维语音数据;
采用预设规格的卷积核,并基于第一预设步长,对该二维语音数据进行卷积;
对卷积后的语音数据按照第二预设步长进行最大池化maxpooling采样,得到所述语音采样数据。
优选地,所述步骤S2包括:
对所述语音采样数据进行预加重及加窗处理,对每一个加窗进行傅立叶变换得到对应的频谱,将所述频谱输入梅尔滤波器以输出得到梅尔频谱;
在梅尔频谱上进行倒谱分析以获得梅尔频率倒谱系数MFCC,基于所述梅尔频率倒谱系数MFCC组成对应的声纹特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711161344.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:连接器组件及移动终端
- 下一篇:一种连接器的固定组件和移动终端