[发明专利]一种声纹动态口令的建模和验证方法在审

申请号：	201410295168.X	申请日：	2014-06-26
公开（公告）号：	CN104064189A	公开（公告）日：	2014-09-24
发明（设计）人：	洪青阳	申请（专利权）人：	厦门天聪智能软件有限公司
主分类号：	G10L17/04	分类号：	G10L17/04
代理公司：	厦门南强之路专利事务所(普通合伙) 35200	代理人：	马应森
地址：	361008 福建省***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种声纹动态口令建模验证方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种语音生物特征识别技术，尤其是涉及防录音冒充的一种声纹动态口令的建模和验证方法。

背景技术

如今，信息安全已发展成为一个全世界网民普遍关注的热点问题。就在2011年底，互联网上传出全球最大的中文IT社区CSDN.NET遭遇黑客攻击，600万用户账号及明文密码泄露，用户资料被大量传播，引起了网民的集体恐慌。由此看来，传统的身份安全认证手段已受到严重威胁。相比传统基于文本密码匹配的身份认证，生物特征识别技术具有无可替代的优势。生物特征识别技术包括指纹识别、人脸识别、掌静脉识别、声纹识别等。其中声纹识别尤其适用于远程身份认证，被誉为“远程DNA”。

声纹识别(又称说话人识别)是从说话人发出的语音信号中自动提取说话人信息，并对说话人进行身份识别的过程。声纹识别具有特征采集设备成本低廉、交互自然等优点，仅需要一个麦克风就能轻松获取我们的语音特征，并能实现电话声纹识别。近年来，声纹识别技术开始应用于司法社区矫正、银行身份认证等领域。

声纹识别技术包括文本无关和文本相关类型，其中文本无关类型允许用户随便说，但一般要采集足够长的有效语音，才能保证识别效果。文本相关类型要求用户验证时要说与登记时一样的语音内容，才能合法通过。但这两种类型均存在一个风险，就是录音冒充问题。如果冒充者拿高保真的录音设备，录下合法用户的语音，则很有可能冒充通过。

为规避录音冒充风险，可在每次验证时，产生随机动态口令(文本内容不一样)，并要求用户按照动态口令内容读出语音，否则不予通过。这种声纹识别方式，可称为文本提示型，或声纹动态口令。针对这种认证方式，已有发明专利提出申请，如基于动态密码语音的身份确认系统及方法(中国专利申请号：20131023555.0)。但该申请采用动态密码对应的整个字符串(如“438259”)做为HMM(隐马尔科夫模型)建模单元，不方便扩充(例如要更换字符，把数字换成非数字的汉字，则原有的字符发音都不能用)，而且每次验证时，均需要重新建模，也即重新训练对应的密码声学HMM，不仅实时性会降低，而且可靠性也会受到影响。

发明内容

本发明的目的在于提供只需要声纹登记时进行一次建模过程，验证时不再需要重新建模，方便高效，结合HMM和GMM(或i-vector)，把语音识别和声纹识别技术更好的融合在一起，使得身份认证系统更加可靠的一种声纹动态口令的建模和验证方法。

本发明包括如下步骤：

1)声纹建模：声纹系统提示用户输入语音，接收到语音并检查合格后，进行声纹建模；

2)声纹验证：声纹系统产生随机动态口令，生成相应的受限语法，然后根据用户输入的语音，进行语音识别和声纹确认；

3)声纹系统根据融合分数，与事先设定的阈值比对，给出接受或拒绝的结果。

在步骤1)中，所述声纹建模的方法可为：若基于HMM，则以声韵母为语音识别建模单元；若基于GMM或i‐vector，则对声纹特征进行建模。

在步骤2)中，所述生成相应的受限语法的方法可为：基于声韵母词典和动态口令内容，生成受限语法，对语音内容进行匹配，匹配越一致，则语音识别得分越高；同时，对声纹特征进行1∶1比对，得到声纹确认得分。

在步骤3)中，所述声纹系统根据融合分数，与事先设定的阈值比对的具体方法可为：将语音识别得分和声纹确认得分根据以下公式进行融合：

scoreFused＝1/(1+exp(-(scoreASR/2+α*scoreVPR)))

其中，scoreFused是系统融合得分，scoreASR是基于HMM的语音识别得分，scoreVPR是GMM(或i-vector)的声纹确认得分，α是调节系数，可根据实际应用调节；

最后，系统融合得分将与预设阈值比对，超过阈值则表示接受通过，未超过则予以拒绝。

所述预设阈值可根据实际应用做调整。

本发明将语音识别和声纹识别技术有效地融合在一起，并且在验证时不用重新建模。其中语音识别是基于隐马尔科夫模型(HMM)，采用声韵母建模单元，根据动态口令内容，实时生成受限语法，对语音内容进行有效识别，同时得到针对该受限语法的语音识别得分。声纹识别可基于高斯混合模型(GMM)或i‐vector，对说话人的身份进行有效确认，得出声纹识别得分。本发明最后根据语音识别和声纹识别融合后的得分，进行说话人身份和内容的双重验证，因此可有效防止录音冒充，大大提升声纹识别系统的准确性和可靠性。

附图说明

图1为声纹建模过程。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门天聪智能软件有限公司，未经厦门天聪智能软件有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410295168.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种声纹动态口令的建模和验证方法在审

专利文献下载