[发明专利]一种声纹动态口令的建模和验证方法在审
申请号: | 201410295168.X | 申请日: | 2014-06-26 |
公开(公告)号: | CN104064189A | 公开(公告)日: | 2014-09-24 |
发明(设计)人: | 洪青阳 | 申请(专利权)人: | 厦门天聪智能软件有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361008 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 动态 口令 建模 验证 方法 | ||
技术领域
本发明涉及一种语音生物特征识别技术,尤其是涉及防录音冒充的一种声纹动态口令的建模和验证方法。
背景技术
如今,信息安全已发展成为一个全世界网民普遍关注的热点问题。就在2011年底,互联网上传出全球最大的中文IT社区CSDN.NET遭遇黑客攻击,600万用户账号及明文密码泄露,用户资料被大量传播,引起了网民的集体恐慌。由此看来,传统的身份安全认证手段已受到严重威胁。相比传统基于文本密码匹配的身份认证,生物特征识别技术具有无可替代的优势。生物特征识别技术包括指纹识别、人脸识别、掌静脉识别、声纹识别等。其中声纹识别尤其适用于远程身份认证,被誉为“远程DNA”。
声纹识别(又称说话人识别)是从说话人发出的语音信号中自动提取说话人信息,并对说话人进行身份识别的过程。声纹识别具有特征采集设备成本低廉、交互自然等优点,仅需要一个麦克风就能轻松获取我们的语音特征,并能实现电话声纹识别。近年来,声纹识别技术开始应用于司法社区矫正、银行身份认证等领域。
声纹识别技术包括文本无关和文本相关类型,其中文本无关类型允许用户随便说,但一般要采集足够长的有效语音,才能保证识别效果。文本相关类型要求用户验证时要说与登记时一样的语音内容,才能合法通过。但这两种类型均存在一个风险,就是录音冒充问题。如果冒充者拿高保真的录音设备,录下合法用户的语音,则很有可能冒充通过。
为规避录音冒充风险,可在每次验证时,产生随机动态口令(文本内容不一样),并要求用户按照动态口令内容读出语音,否则不予通过。这种声纹识别方式,可称为文本提示型,或声纹动态口令。针对这种认证方式,已有发明专利提出申请,如基于动态密码语音的身份确认系统及方法(中国专利申请号:20131023555.0)。但该申请采用动态密码对应的整个字符串(如“438259”)做为HMM(隐马尔科夫模型)建模单元,不方便扩充(例如要更换字符,把数字换成非数字的汉字,则原有的字符发音都不能用),而且每次验证时,均需要重新建模,也即重新训练对应的密码声学HMM,不仅实时性会降低,而且可靠性也会受到影响。
发明内容
本发明的目的在于提供只需要声纹登记时进行一次建模过程,验证时不再需要重新建模,方便高效,结合HMM和GMM(或i-vector),把语音识别和声纹识别技术更好的融合在一起,使得身份认证系统更加可靠的一种声纹动态口令的建模和验证方法。
本发明包括如下步骤:
1)声纹建模:声纹系统提示用户输入语音,接收到语音并检查合格后,进行声纹建模;
2)声纹验证:声纹系统产生随机动态口令,生成相应的受限语法,然后根据用户输入的语音,进行语音识别和声纹确认;
3)声纹系统根据融合分数,与事先设定的阈值比对,给出接受或拒绝的结果。
在步骤1)中,所述声纹建模的方法可为:若基于HMM,则以声韵母为语音识别建模单元;若基于GMM或i‐vector,则对声纹特征进行建模。
在步骤2)中,所述生成相应的受限语法的方法可为:基于声韵母词典和动态口令内容,生成受限语法,对语音内容进行匹配,匹配越一致,则语音识别得分越高;同时,对声纹特征进行1∶1比对,得到声纹确认得分。
在步骤3)中,所述声纹系统根据融合分数,与事先设定的阈值比对的具体方法可为:将语音识别得分和声纹确认得分根据以下公式进行融合:
scoreFused=1/(1+exp(-(scoreASR/2+α*scoreVPR)))
其中,scoreFused是系统融合得分,scoreASR是基于HMM的语音识别得分,scoreVPR是GMM(或i-vector)的声纹确认得分,α是调节系数,可根据实际应用调节;
最后,系统融合得分将与预设阈值比对,超过阈值则表示接受通过,未超过则予以拒绝。
所述预设阈值可根据实际应用做调整。
本发明将语音识别和声纹识别技术有效地融合在一起,并且在验证时不用重新建模。其中语音识别是基于隐马尔科夫模型(HMM),采用声韵母建模单元,根据动态口令内容,实时生成受限语法,对语音内容进行有效识别,同时得到针对该受限语法的语音识别得分。声纹识别可基于高斯混合模型(GMM)或i‐vector,对说话人的身份进行有效确认,得出声纹识别得分。本发明最后根据语音识别和声纹识别融合后的得分,进行说话人身份和内容的双重验证,因此可有效防止录音冒充,大大提升声纹识别系统的准确性和可靠性。
附图说明
图1为声纹建模过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门天聪智能软件有限公司,未经厦门天聪智能软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410295168.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:混音方法及装置
- 下一篇:一种钢琴击弦机顶杆润滑处理方法