[发明专利]一种语音识别验证处理方法及装置在审
申请号: | 202210853098.X | 申请日: | 2022-07-20 |
公开(公告)号: | CN115022087A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 黄淋;宁博;刘金山;饶宇熹 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G10L25/69;G10L25/30;G10L25/24;G10L25/18;G10L15/02 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王首峰;任默闻 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 验证 处理 方法 装置 | ||
本发明提供一种语音识别验证处理方法及装置,涉及语音技术领域,可用于金融领域或其他技术领域。所述方法包括:获取原始语音信号,对所述原始语音信号进行预处理,得到由二维数据表示的第一语谱图;基于预设合成语音识别模型对所述第一语谱图进行合成语音识别;若确定合成语音识别结果为非合成语音,则对非合成语音的语音信号进行声纹识别,并对声纹识别结果是否为目标人本人声音进行验证,得到验证结果。所述装置执行上述方法。本发明实施例提供的语音识别验证处理方法及装置,能够提高语音识别验证的准确性,进而保证用户身份信息安全。
技术领域
本发明涉及语音技术领域,具体涉及一种语音识别验证处理方法及装置。
背景技术
随着声音技术的发展,通过识别声音可以给人们生活工作带来便利,但也给有些不法分子带来可乘之机。
不法分子通过假冒说话人语音和合成说话人语音等方式,冒充说话人身份,进而从事非法活动,现有技术对合成说话人语音的识别准确率不高。
发明内容
针对现有技术中的问题,本发明实施例提供一种语音识别验证处理方法及装置,能够至少部分地解决现有技术中存在的问题。
一方面,本发明提出一种语音识别验证处理方法,包括:
获取原始语音信号,对所述原始语音信号进行预处理,得到由二维数据表示的第一语谱图;
基于预设合成语音识别模型对所述第一语谱图进行合成语音识别;所述预设合成语音识别模型根据合成语音样本数据训练卷积循环神经网络得到;
若确定合成语音识别结果为非合成语音,则对非合成语音的语音信号进行声纹识别,并对声纹识别结果是否为目标人本人声音进行验证,得到验证结果。
其中,所述对所述原始语音信号进行预处理,得到由二维数据表示的第一语谱图,包括:
对所述原始语音信号进行预加重处理,以提升所述原始语音信号在高频部分的信噪比;
对预加重处理后的语音信号进行分帧加窗处理,并对分帧加窗处理后的语音信号进行快速傅里叶变换,得到每帧语音信号对应的频谱;
对各频谱的频谱幅度分别进行求平方计算,并将求平方计算结果按照时间维度进行拼接,得到所述第一语谱图。
其中,所述卷积循环神经网络包括依次相连的第一卷积神经网络和第一循环神经网络;相应的,所述基于预设合成语音识别模型对所述第一语谱图进行合成语音识别,包括:
基于所述第一卷积神经网络对所述第一语谱图进行特征提取,得到空间局部特征;
基于所述第一循环神经网络对所述空间局部特征进行特征提取,得到由时间序列表示的语音特征;
基于第一全连接层对所述语音特征进行识别,得到合成语音识别结果。
其中,所述对非合成语音的语音信号进行声纹识别,包括:
对非合成语音的语音信号进行浅层语音特征提取,得到浅层语音特征;
对非合成语音的语音信号进行深层语音特征提取,得到深层语音特征;
融合所述浅层语音特征和所述深层语音特征,得到融合语音特征;
基于第二全连接层对所述融合语音特征进行识别,得到声纹识别结果。
其中,所述对非合成语音的语音信号进行深层语音特征提取,得到深层语音特征,包括:
对非合成语音的语音信号进行预处理,得到第二语谱图;
基于预设语音特征提取模型对所述第二语谱图进行深层语音特征提取,得到深层语音特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210853098.X/2.html,转载请声明来源钻瓜专利网。