[发明专利]语音对抗样本检测方法、装置、终端设备以及存储介质有效

申请号：	202011200369.9	申请日：	2020-11-02
公开（公告）号：	CN112017669B	公开（公告）日：	2021-02-23
发明（设计）人：	黄浩;艾建文;张伟哲;张宾;钟晓雄	申请（专利权）人：	鹏城实验室
主分类号：	G10L15/32	分类号：	G10L15/32;G10L15/06;G10L15/16;G10L21/0208
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	晏波
地址：	518000 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音对抗样本检测方法装置终端设备以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种语音对抗样本检测方法，所述方法包括以下步骤：获取待检测语音信息；利用预设优化算法对所述待检测语音信息进行优化，获得预处理语音信息；基于所述预处理语音信息和所述待检测语音，获得语音信息集；将所述语音信息集中的语音信息分别输入语音识别模型中进行识别，获得语音识别结果集；基于所述语音识别结果集，获得所述语音识别结果集的相似度得分矩阵；基于所述相似度得分矩阵，获得所述待检测语音信息的语音对抗样本检测结果。本发明还公开了一种语音对抗样本检测装置、终端设备以及存储介质。可以对待检测语音中的未知语音对抗样本进行检测。

技术领域

本发明涉及语音识别技术领域，特别涉及一种语音对抗样本检测方法、装置、终端设备以及存储介质。

背景技术

随着科技的快速发展，语音识别技术逐渐成为人们生活中的关键技术之一。智能设备通过对输入的语音信息提取相关信息并加以处理，可以转录处正确的文字内容，甚至实现和人们的交流互动。随着研究者的不懈努力，语音识别技术逐渐走向成熟，识别精度不断提高，应用范围也不断扩大，为人们的生产生活带来了极大的便利。然而最新的科学研究表明，语音信息常常包括对抗样本。攻击者通过在原始语音信息中添加经过精心计算后的微小扰动，使得语音信息被识别为错误的短语，而这种扰动通常是人耳所不能察觉的。在现实生活场景中，这些扰动可能让原始语音信息转录成截然不同的短语，使得被控制的智能设备做出错误的操作，甚至有可能造成隐私的泄露或者带来安全威胁。

但是，现有的语音识别技术只能对已知的语音对抗样本进行清除，无法对未知的对抗样本进行防御。

发明内容

本发明的主要目的是提供一种语音对抗样本检测方法、装置、终端设备以及存储介质，旨在解决现有技术中只能对已知的语音对抗样本进行清除，无法对未知的对抗样本进行防御的技术问题。

为实现上述目的，本发明提出的一种语音对抗样本检测方法，所述方法包括以下步骤：

获取待检测语音信息；

利用预设优化算法对所述待检测语音信息进行优化，获得预处理语音信息；

基于所述预处理语音信息和所述待检测语音，获得语音信息集；

将所述语音信息集中的语音信息分别输入语音识别模型中进行识别，获得语音识别结果集；

基于所述语音识别结果集，获得所述语音识别结果集的相似度得分矩阵；

基于所述相似度得分矩阵，获得所述待检测语音信息的语音对抗样本检测结果。

可选的，所述预设优化算法包括多种预设优化算法；所述利用预设优化算法对所述待检测语音信息进行优化，获得预处理语音信息的步骤包括：

利用所述多种预设优化算法分别对所述待检测语音信息进行优化，获得多个预处理语音信息；