[发明专利]公共背景噪声下激活式的声纹密码安全控制方法及系统在审
申请号: | 201710285878.8 | 申请日: | 2017-04-27 |
公开(公告)号: | CN107172018A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 金亚强;殷瑞祥 | 申请(专利权)人: | 华南理工大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G10L21/0208;G10L25/45 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公共 背景 噪声 激活 声纹 密码 安全 控制 方法 系统 | ||
1.一种公共背景噪声下激活式的声纹密码安全控制方法,其特征在于,包括下述步骤:
S1、激活识别模块在普通环境下实时进行语音信号监测,若检测到语音信号,则对语音信号进行预加重、加窗和分帧处理,并求取语音信号的幅度值;根据实验得到语音信号与噪声之间的信噪比,并将信噪比转化为幅度差T;设T为判决门限值,若语音信号的前一帧与后一帧只差大于等于T,则认为进入静默期;若语音信号的前一帧与后一帧只差小于T,则判断是激活标志,并激活声源定位拾取模块;
S2、声源定位拾取模块通过麦克风阵列接收交互目标声源数据,并对交互目标声源进行到达时延差的估计;
S3、对估计后的到达时延差,结合麦克风阵列的位置构造多个双曲面,并计算每个双曲面的焦点,确定交互目标声源位置,从而在交互目标声源位置得到交互目标声源的语音信号;
S4、预处理模块对交互目标声源的语音信号进行预处理,预处理包括预滤波、采样、量化、模式转换、预加重、加窗、分帧处理、端点检测以及生产MFCC_D特征参数过程;
S5、对预处理后的语音信号,声纹密码识别模块提取特征参数,将特征参数与录音库的指令文本进行匹配。
2.如权利要求1所述的公共背景噪声下激活式的声纹密码安全控制方法,其特征在于,所述步骤S2中对目标声源进行到达时延差的估计,包括在二维空间和三维空间对目标声源进行到达时延差的估计;其中
所述二维空间对目标声源进行到达时延差的估计,具体为:设麦克风阵列包括三个麦克风,相邻麦克风之间的距离为Δd,以阵列中心的麦克风为参考点,目标声源距参考点的距离为r,目标声源与距离r关系满足下式:
式中,τ1、τ2分别是麦克风阵列两侧的两个麦克风与参考点麦克风的时延差,v为声速;其中,上式中表示出目标声源相对于麦克风阵列的极坐标(r,θ)为:
由上式得,只要获知τ1、τ2的值,即可唯一确定目标声源的极坐标;
所述三维空间对目标声源进行到达时延差的估计,具体为:建立麦克风阵列模型,所述麦克风阵列模型包括两个平行的麦克风阵列,每个麦克风阵列包括三个麦克风;其中,麦克风阵列间距为d,且每个麦克风阵列均以中间的麦克风为参考点,把其中一个麦克风阵列的参考点作为原点,建立三维坐标系;设目标声源的球坐标为根据三个麦克风均匀线阵近场信号模型中,完成目标声源坐标中(r,θ)的确定,所以只需确定方位角即可完成目标声源的三维定位:
首先,分别在麦克风阵列中通过上述二维空间对目标声源进行到达时延差的估计算法,得到目标声源相对两个麦克风阵列参考点的极坐标(r,θ)与(r',θ'),则由阵列的几何关系有:
其中,由上式得,给定一个方位角φ',就能由(r,θ)唯一地确定一组(r”,θ”);引入误差函数在[-90°,90°]的范围内遍历方位角值,取使得误差函数最小的为目标声源方位角的最佳估值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710285878.8/1.html,转载请声明来源钻瓜专利网。