[发明专利]电子装置、基于声纹的身份验证方法及存储介质在审

申请号：	201711161344.0	申请日：	2017-11-21
公开（公告）号：	CN107993071A	公开（公告）日：	2018-05-04
发明（设计）人：	赵峰;王健宗;程宁;郑斯奇;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06Q20/40	分类号：	G06Q20/40;G10L17/08;G10L17/18;G10L25/24
代理公司：	深圳市沃德知识产权代理事务所(普通合伙)44347	代理人：	高杰,于志光
地址：	518000 广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	电子装置基于声纹身份验证方法存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信技术领域，尤其涉及一种电子装置、基于声纹的身份验证方法及存储介质。

背景技术

目前，很多大型金融公司的业务范围涉及保险、银行、投资等多个业务范畴，而每个业务范畴通常都需要同客户进行沟通，因此，对客户的身份验证也就成为保证业务安全的重要组成部分。为了满足业务的实时性需求，目前这类金融公司通常采用人工方式对客户的身份进行分析验证，但是由于客户群体庞大，单一依靠人工进行判别分析不仅费时费力、容易出错，而且也会极大地增加业务成本；另外，有些金融公司尝试采用语音自动识别的方式自动对用户的身份进行鉴别，然而，这类现有的语音自动识别方式的准确率低，有待改进。因此，如何提供准确性高的语音自动识别方案已经成为一个亟待解决的技术问题。

发明内容

本发明的目的在于提供一种电子装置、基于声纹的身份验证方法及存储介质，旨在提高身份验证的准确性及效率。

为实现上述目的，本发明提供一种电子装置，所述电子装置包括存储器及与所述存储器连接的处理器，所述存储器中存储有可在所述处理器上运行的处理系统，所述处理系统被所述处理器执行时实现如下步骤：

分帧采样步骤，在接收到待进行身份验证的目标用户的语音数据后，调用预定的卷积神经网络CNN模型对该语音数据进行分帧和采样，得到语音采样数据；

提取步骤，利用预设滤波器对该语音采样数据进行处理以提取预设类型声纹特征，并基于该预设类型声纹特征构建所述语音数据对应的声纹特征向量；

构建步骤，将该声纹特征向量输入预先训练的背景信道模型，以构建出所述语音数据的当前声纹鉴别向量；

验证步骤，计算该当前声纹鉴别向量与预存的该目标用户的标准声纹鉴别向量之间的空间距离，基于该空间距离对该用户进行身份验证，并生成验证结果。

优选地，所述分帧采样步骤，具体包括：

对该语音数据进行分帧，将分帧后的语音数据以帧为行，以帧内数据为列，得到该语音数据对应的二维语音数据；

采用预设规格的卷积核，并基于第一预设步长，对该二维语音数据进行卷积；

对卷积后的语音数据按照第二预设步长进行最大池化maxpooling采样，得到所述语音采样数据。

优选地，所述提取步骤，具体包括：

对所述语音采样数据进行预加重及加窗处理，对每一个加窗进行傅立叶变换得到对应的频谱，将所述频谱输入梅尔滤波器以输出得到梅尔频谱；

在梅尔频谱上进行倒谱分析以获得梅尔频率倒谱系数MFCC，基于所述梅尔频率倒谱系数MFCC组成对应的声纹特征向量。

优选地，所述验证步骤，具体包括：

计算该当前声纹鉴别向量与预存的该目标用户的标准声纹鉴别向量之间的余弦距离：为所述标准声纹鉴别向量，为当前声纹鉴别向量；

若所述余弦距离小于或者等于预设的距离阈值，则生成验证通过的信息；

若所述余弦距离大于预设的距离阈值，则生成验证不通过的信息。

为实现上述目的，本发明还提供一种基于声纹的身份验证方法，所述基于声纹的身份验证方法包括：

S1，在接收到待进行身份验证的目标用户的语音数据后，调用预定的卷积神经网络CNN模型对该语音数据进行分帧和采样，得到语音采样数据；

S2，利用预设滤波器对该语音采样数据进行处理以提取预设类型声纹特征，并基于该预设类型声纹特征构建所述语音数据对应的声纹特征向量；

S3，将该声纹特征向量输入预先训练的背景信道模型，以构建出所述语音数据的当前声纹鉴别向量；

S4，计算该当前声纹鉴别向量与预存的该目标用户的标准声纹鉴别向量之间的空间距离，基于该空间距离对该用户进行身份验证，并生成验证结果。

优选地，所述步骤S1包括：

对该语音数据进行分帧，将分帧后的语音数据以帧为行，以帧内数据为列，得到该语音数据对应的二维语音数据；

采用预设规格的卷积核，并基于第一预设步长，对该二维语音数据进行卷积；

对卷积后的语音数据按照第二预设步长进行最大池化maxpooling采样，得到所述语音采样数据。

优选地，所述步骤S2包括：

对所述语音采样数据进行预加重及加窗处理，对每一个加窗进行傅立叶变换得到对应的频谱，将所述频谱输入梅尔滤波器以输出得到梅尔频谱；

在梅尔频谱上进行倒谱分析以获得梅尔频率倒谱系数MFCC，基于所述梅尔频率倒谱系数MFCC组成对应的声纹特征向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711161344.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q20-00 支付体系结构、方案或协议
G06Q20-02 .涉及中立的第三方，例如认证机构、公证人或可信的第三方[TTP]
G06Q20-04 .支付电路
G06Q20-08 .支付体系结构
G06Q20-22 .支付方案或模式
G06Q20-30 .以特定设备的使用为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]电子装置、基于声纹的身份验证方法及存储介质在审

专利文献下载