[发明专利]一种用于语音重放检测的特征提取方法及装置有效
申请号: | 201810191512.9 | 申请日: | 2018-03-08 |
公开(公告)号: | CN108364656B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 郑方;李通旭;邬晓钧 | 申请(专利权)人: | 北京得意音通技术有限责任公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L25/18;G10L25/78 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 100000 北京市海淀区清华*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 重放 检测 特征 提取 方法 装置 | ||
本发明提供了一种用于语音重放检测的特征提取方法及装置,该方法包括:对获取的语音信号进行1.5维谱估计,得到语音信号的1.5维谱特征;采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后的语音信号的能量分布特征;对所述语音信号的1.5维谱特征和规整后的能量分布特征进行融合,得到1.5‑SFED(1.5Spectrum Fuse Energy Distribution)特征。本发明提高了语音重放检测的准确性。
技术领域
本发明涉及计算机信息服务技术领域,具体而言,涉及一种语音重放检测的特征提取方法及装置。
背景技术
说话人识别技术又称为声纹识别技术,主要是基于语音中说话人所包含的个性特征的信息,利用计算机以及各种信息识别技术,自动地实现说话人身份的确认。
近几年,随着互联网的飞速发展,语音作为一种非接触信息载体,人们可以依靠各种移动终端设备,例如:手机、麦克风和IP电话等,随时随地的完成语音采集,并通过网络传输和后台服务来实现人机交互和说话人识别。
互联网在给予人们方便快捷的同时,也带来了许多安全隐患。若说话人A的语音被企图闯入者预先窃取并录制,继而将录制的语音重新播放或经拼接处理后重新播放至说话人识别系统,说话人识别系统通常难以区分,从而导致企图闯入者成功地以说话人A的录音闯入说话人A的账号,进而对说话人A的账号带来了极大的安全隐患。
相关技术中,为了避免录音重放闯入,一种是建立用户信道模型,将用户与特定信道绑来进行语音重放检测。一种是辅以语音识别技术来进行语音重放检测。在进行语音检测的过程中,语音检测系统通过采用随机挑选的提示语句让待识别用户跟读,或者采用随机挑选的提示问题让待识别用户回答,并通过判断待识别用户跟读或者回答的内容是否与语音检测系统展示给待识别用户需要跟读或回答问题的内容是否一致,对待识别用户的身份进行验证。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
通过建立说话人信道模型的语音重放检测的方法,受到说话人和特定信道的限制,不能在未知用户身份或信道的情况下,获得好的语音重放检测效果,应用不具有普遍性。用语音识别技术来进行语音重放检测,当待识别用户口音严重或者有自己特殊发音习惯时,语音识别系统有可能不能正确识别出待识别用户发出的语音内容,不能进行更有效的特征提取,降低了身份验证的性能。
发明内容
有鉴于此,本发明的目的在于提供一种用于语音重放检测的特征提取方法及装置,能够准确的提取重放语音的特征,以提高说话人识别中的闯入者语音重放攻击检测的效率。
第一方面,本发明实施例提供了一种用于语音重放检测的特征提取方法,包括:
对获取的语音信号进行1.5维谱估计,得到语音信号的1.5维谱特征;
采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后的语音信号的能量分布特征;
对所述语音信号的1.5维谱特征和规整后的能量分布特征进行融合,得到1.5SFED特征。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后语音信号的能量分布特征之前,还包括:
对所述语音信号进行语音活动检测,检测出所述语音信号的静音段数据,并去除所述语音信号的静音段数据。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后语音信号的能量分布特征之前,还包括:
对去除静音段数据的语音信号依次进行预加重、分帧、加窗、快速傅立叶变换处理,得到语音信号的频谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京得意音通技术有限责任公司,未经北京得意音通技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810191512.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音处理方法、介质、装置和计算设备
- 下一篇:处理丢失帧的方法和解码器