[发明专利]一种语音和唇语相融合的身份认证方法在审
申请号: | 201910603999.1 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110364163A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 张新曼;申沅均;陈奕宇;公维勇;王寅;尚东鹏;许学斌 | 申请(专利权)人: | 西安交通大学;广东顺德西安交通大学研究院 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G10L25/24;G10L15/06;G10L25/45;G10L25/51;G10L17/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 身份认证 语音 融合 认证成功 向量特征 倒频谱 身份认证系统 极限学习机 并行策略 认证领域 认证失败 生物特征 输出结果 信息安全 训练样本 多输出 强健性 提示符 多模 复数 向量 输出 认证 | ||
本发明公开了一种语音和唇语相融合的身份认证方法,涉及信息安全及模式认证领域。该语音和唇语相融合的身份认证方法包括以下步骤:1)提取待认证的语音倒频谱特征和唇语特征;2)采用并行策略融合所述语音倒频谱特征和所述唇语特征,得到复向量特征;3)利用复向量特征作为训练样本训练复数极限学习机的多输入多输出模型,根据输出的分布及其取值判断是否认证成功;若输出结果向量中的最大值与提示符一致且该值大于设定阈值,则认证成功;否则,认证失败。该语音和唇语相融合的身份认证方法,采用语音和唇语相结合的多模生物特征进行身份认证,提高了身份认证系统的强健性。
技术领域
发明涉及信息安全及模式认证领域,具体涉及一种语音和唇语相融合的身份 认证方法。
背景技术
随着网络信息技术的飞速发展,世界进入了移动互联网时代。2017年上半年, 智能手机几乎人手一部。移动电商和网上银行等虚拟移动支付平台也随之兴起, 但是与此同时,网络病毒、黑客以及电信诈骗等网络犯罪时刻威胁着手机用户的 信息安全,甚至可能造成重大的经济损失。因此,亟待一个高度可靠的身份认证 系统,将生物特征认证和智能手机平台进行融合由此应运而生。
语音认证是被认为在智能手机认证上具有广泛应用前景的生物特征认证技 术之一。语音认证具有非接触、非侵入性和易于使用的特点。近年来也在取得了 技术上的重大的突破,例如在语音识别的Switchboard任务方面,最新的IBM已 经能将错误率控制在5.5%之下,有经验的转写人员在这个任务中可以达到4%之 下。因此,这类安静环境下的语音识别系统已经近似于人类水平。但单通道的语 音认证受环境影响较大,其认证准确率也有待进一步的提高。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供一种语音和唇语相融合的 身份认证方法。
为达到上述目的,本发明采用以下技术方案予以实现:
一种语音和唇语相融合的身份认证方法,包括以下步骤:
1)提取待认证的语音倒频谱特征和唇语特征;
2)采用并行策略融合所述语音倒频谱特征和所述唇语特征,得到复向量特 征;
3)利用复向量特征作为训练样本训练复数极限学习机的多输入多输出模型, 根据输出的分布及其取值判断是否认证成功;
若输出结果向量中的最大值与设定提示符一致且最大值大于设定阈值,则认 证成功;否则,认证失败。
进一步的,步骤1)中语音倒频谱特征的提取方法具体过程为:
利用双门限法对语音信号进行分段,并采用梅尔滤波器提取语音倒频谱特征。
进一步的,利用双门限法对语音信号进行分段的具体过程为:
用交叠分段的方法对语音信号进行分帧,得到短时序列;
用窗函数乘以短时序列,形成短时加窗语音信号;
利用短时加窗语音信号的短时能量和短时过零率截出语音段的起止点,起止 点之间的语音即为有效语音段。
进一步的,利用短时加窗语音信号的短时能量和短时过零率截出有效语音段 的起止点的具体过程包括以下步骤:
1)计算每帧音频的短时能量和短时过零率,计算公式如下所示,短时能量 为
短时过零率为
其中,xn(m)代表第n帧的第m个序列值,sgn[]代表符号函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;广东顺德西安交通大学研究院,未经西安交通大学;广东顺德西安交通大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910603999.1/2.html,转载请声明来源钻瓜专利网。