[发明专利]一种人脸声纹特征融合验证的方法在审
申请号: | 201910641594.7 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110363148A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 胡增;江大白 | 申请(专利权)人: | 中用科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T3/40;G06T3/60;G06T5/10;G10L17/00;G10L25/24;G10L25/45 |
代理公司: | 成都天汇致远知识产权代理事务所(普通合伙) 51264 | 代理人: | 陆岩 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 验证 声纹特征 人脸 融合 频域信号 时域信号 短时傅里叶变换 图像 二维人脸图像 正弦信号分量 直流信号分量 对数频谱 加窗分帧 频率转换 声音频谱 声音文件 特征向量 线性关系 向量转换 一次验证 应用层 误检 感知 解析 转换 分析 联合 | ||
本发明提供一种人脸声纹特征融合验证的方法,包括以下步骤:将输入的声音文件解析成声音的时域信号;通过短时傅里叶变换和加窗分帧将所述时域信号转变为频域信号;通过对数频谱变换将频率转换成人耳能感知的线性关系;通过倒频分析,采用DCT变换将转换后的频域信号中的直流信号分量和正弦信号分量分离;提取声音频谱特征向量,将所述向量转换成图像;将所述图像与二维人脸图像融合。本发明提出的人脸声纹特征融合验证的方法,可以达到仅做一次验证的效果,并且不会有应用层联合验证中一种方式误检会造成整个验证不通过的问题,提高了使用体验。
技术领域
本发明涉及生物特征识别领域,特别是指一种人脸声纹特征融合验证的方法。
背景技术
近些年,随着深度学习以及计算机视觉技术的不断发展成熟,在生物特征识别中基于计算机视觉技术的几种身份认证技术也得到了快速发展,尤其是人脸识别技术,具有无接触、识别快的特点,已广泛应用于各种需要验证身份的业务中。声纹识别作为生物识别的一种,是根据说话人的声波特性进行身份辨识的服务。身份辨识与口音无关,与语言无关,可以用于说话人辨认和说话人确认。
虽然多种生物识别技术逐渐被人们研发运用到生活生产中,但使用方式尚存明显单一性。单一的验证方式总会存在漏检、误检的情况,目前的研究和应用热点在联合使用多种生物识别技术,达到更高的安全性和准确率,例如人脸识别加声纹识别。但是这些方法仅仅是把两项识别技术在应用层结合起来使用,比如人脸识别加声纹识别就是人脸识别通过后,再验证声纹识别通过。并没有在底层特征层面将人脸特征和声纹特征融合,达到仅做一次验证的效果,并且一种方式误检会造成整个验证不通过,降低使用体验。
发明内容
针对现有技术中存在的上述不足之处,本发明要解决的技术问题是提供一种人脸声纹特征融合验证的方法。
本发明为实现上述目的所采用的技术方案是:一种人脸声纹特征融合验证的方法,包括以下步骤:
将输入的声音文件解析成声音的时域信号;
通过短时傅里叶变换和加窗分帧将所述时域信号转变为频域信号;
通过对数频谱变换将所述频域信号中的频率转换成人耳能感知的线性关系;
通过倒频分析,采用DCT变换将转换后的频域信号中的直流信号分量和正弦信号分量分离;
提取声音频谱特征向量,将所述向量转换成图像;
将所述图像与二维人脸图像融合。
所述通过短时傅里叶变换和加窗分帧将所述时域信号转变为频域信号,具体为:
选择一个时频局部化的窗函数h(t),通过短时傅里叶变换计算出各个不同时刻的功率谱,所述短时傅里叶变换的公式为:
其中,f(τ)代表输入音频的时域信号,τ表示积分变量,t表示所述不同时刻。
所述窗函数为海明窗。
所述通过对数频谱变换将频率转换成人耳能感知的线性关系,具体为:
通过下式将频率标度转化为对数频率标度,使人耳对频率的感知度为线性感知关系:
mel(f)=2595*log10(1+f/700)
其中,mel(f)表示对数频率,f表示短时傅里叶变换后得到的频率。
所述通过倒频分析,采用DCT变换将转换后的频域信号中的直流信号分量和正弦信号分量分离,具体为:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中用科技有限公司,未经中用科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910641594.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种产品表面字符识别方法
- 下一篇:笔迹的处理方法和装置