[发明专利]语音对抗样本检测方法、装置、终端设备以及存储介质有效
申请号: | 202011200369.9 | 申请日: | 2020-11-02 |
公开(公告)号: | CN112017669B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 黄浩;艾建文;张伟哲;张宾;钟晓雄 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/06;G10L15/16;G10L21/0208 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
地址: | 518000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 对抗 样本 检测 方法 装置 终端设备 以及 存储 介质 | ||
本发明公开一种语音对抗样本检测方法,所述方法包括以下步骤:获取待检测语音信息;利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;基于所述预处理语音信息和所述待检测语音,获得语音信息集;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。本发明还公开了一种语音对抗样本检测装置、终端设备以及存储介质。可以对待检测语音中的未知语音对抗样本进行检测。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音对抗样本检测方法、装置、终端设备以及存储介质。
背景技术
随着科技的快速发展,语音识别技术逐渐成为人们生活中的关键技术之一。智能设备通过对输入的语音信息提取相关信息并加以处理,可以转录处正确的文字内容,甚至实现和人们的交流互动。随着研究者的不懈努力,语音识别技术逐渐走向成熟,识别精度不断提高,应用范围也不断扩大,为人们的生产生活带来了极大的便利。然而最新的科学研究表明,语音信息常常包括对抗样本。攻击者通过在原始语音信息中添加经过精心计算后的微小扰动,使得语音信息被识别为错误的短语,而这种扰动通常是人耳所不能察觉的。在现实生活场景中,这些扰动可能让原始语音信息转录成截然不同的短语,使得被控制的智能设备做出错误的操作,甚至有可能造成隐私的泄露或者带来安全威胁。
但是,现有的语音识别技术只能对已知的语音对抗样本进行清除,无法对未知的对抗样本进行防御。
发明内容
本发明的主要目的是提供一种语音对抗样本检测方法、装置、终端设备以及存储介质,旨在解决现有技术中只能对已知的语音对抗样本进行清除,无法对未知的对抗样本进行防御的技术问题。
为实现上述目的,本发明提出的一种语音对抗样本检测方法,所述方法包括以下步骤:
获取待检测语音信息;
利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;
基于所述预处理语音信息和所述待检测语音,获得语音信息集;
将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;
基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;
基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。
可选的,所述预设优化算法包括多种预设优化算法;所述利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息的步骤包括:
利用所述多种预设优化算法分别对所述待检测语音信息进行优化,获得多个预处理语音信息;
所述基于所述预处理语音信息和所述待检测语音信息,获得语音信息集的步骤包括:
基于所述多个预处理语音信息和所述待检测语音信息,获得语音信息集。
可选的,所述语音识别模型包括多个不同的语音识别模型;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集的步骤包括:
将所述语音信息集中的每个语音信息输入所述多个不同的语音识别模型中进行识别,获得所述每个语音信息的多个语音识别结果;
基于所述每个语音信息的多个语音识别结果,获得语音识别结果集。
可选的,基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵的步骤包括:
对所述语音识别结果集中的任意两个语音识别结果计算相似度得分,获得所述语音识别结果集的相似度得分矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011200369.9/2.html,转载请声明来源钻瓜专利网。