[发明专利]一种人脸声纹特征融合验证的方法在审
申请号: | 201910641594.7 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110363148A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 胡增;江大白 | 申请(专利权)人: | 中用科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T3/40;G06T3/60;G06T5/10;G10L17/00;G10L25/24;G10L25/45 |
代理公司: | 成都天汇致远知识产权代理事务所(普通合伙) 51264 | 代理人: | 陆岩 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种人脸声纹特征融合验证的方法,包括以下步骤:将输入的声音文件解析成声音的时域信号;通过短时傅里叶变换和加窗分帧将所述时域信号转变为频域信号;通过对数频谱变换将频率转换成人耳能感知的线性关系;通过倒频分析,采用DCT变换将转换后的频域信号中的直流信号分量和正弦信号分量分离;提取声音频谱特征向量,将所述向量转换成图像;将所述图像与二维人脸图像融合。本发明提出的人脸声纹特征融合验证的方法,可以达到仅做一次验证的效果,并且不会有应用层联合验证中一种方式误检会造成整个验证不通过的问题,提高了使用体验。 | ||
搜索关键词: | 验证 声纹特征 人脸 融合 频域信号 时域信号 短时傅里叶变换 图像 二维人脸图像 正弦信号分量 直流信号分量 对数频谱 加窗分帧 频率转换 声音频谱 声音文件 特征向量 线性关系 向量转换 一次验证 应用层 误检 感知 解析 转换 分析 联合 | ||
【主权项】:
1.一种人脸声纹特征融合验证的方法,其特征在于,包括以下步骤:将输入的声音文件解析成声音的时域信号;通过短时傅里叶变换和加窗分帧将所述时域信号转变为频域信号;通过对数频谱变换将所述频域信号中的频率转换成人耳能感知的线性关系;通过倒频分析,采用DCT变换将转换后的频域信号中的直流信号分量和正弦信号分量分离;提取声音频谱特征向量,将所述向量转换成图像;将所述图像与二维人脸图像融合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中用科技有限公司,未经中用科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910641594.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种产品表面字符识别方法
- 下一篇:笔迹的处理方法和装置