[发明专利]一种有害音频检测方法及装置在审
申请号: | 202011092241.5 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112837677A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 张震;石瑾;李鹏;夏静雯;方磊 | 申请(专利权)人: | 讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/26;G10L25/60;G06F16/68;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 有害 音频 检测 方法 装置 | ||
1.一种有害音频检测方法,其特征在于,包括如下步骤:
步骤SS1:输入语音数据进行连续语音关键词匹配,输出识别的文本内容,从关键词的角度检测待测音频中是否含有有害关键词;
步骤SS2:基于步骤SS1获得的识别的文本内容,采用SVM分类器进行分类,;
步骤SS3:基于元学习进行有害音频分类网络,从文本意图的角度对待测样本进行分类;
步骤SS4:对关键词匹配得分、SVM分类器得分、元学习分类网络得分进行融合,获得待测音频最终被检测为有害音频的得分S。
2.根据权利要求1所述的一种有害音频检测方法,其特征在于,所述步骤SS1具体包括:输入一段语音数据,分别经声学模型识别和语言模型解码后,得到所有可能解码路径的词混淆网络,所述词混淆网络中每条路径的权重代表该条解码路径正确概率的大小;然后输出概率最大的解码路径,也即识别的文本内容;根据专家经验确定与涉毒相关的关键词,利用关键词强制匹配,获取相关候选正例,经专家确认存入正例样本库。
3.根据权利要求1所述的一种有害音频检测方法,其特征在于,所述步骤SS2具体包括:对步骤SS1中确认的所有有害与无害的识别文本利用Bert模型抽取能表征文本意图特征的文本向量V={V1,V1,...,Vn},然后基于支持向量机算法SVM训练一个二分类器,基于文本意图对有害与无害的文本内容进行分类,有害的文本集合记为VT,无害的文本集合记为VF。
4.根据权利要求1所述的一种有害音频检测方法,其特征在于,所述步骤SS3具体包括:设计一个大数据量的意图分类网络称之为基分类器g(x;θ),设计一个参数回归映射网络F(.);给定大数据量的意图分类网络k-shot的标注样本,进行普通的分类训练,得到参数θk,其中k=1,2,...,2n;参数回归映射网络作用:元学习当样本集增大时基分类器参数的映射关系f(θk)=θk+1,训练的目标函数为:
通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,来指导小样本(VT,VF)条件下有害音频的分类网络的学习。
5.根据权利要求1所述的一种有害音频检测方法,其特征在于,所述步骤SS4具体包括:设连续语音关键词匹配的关键词得分为SASR,SVM分类器得分为SSVM,元学习分类网络的得分为Smeta,则待测音频最终被检测为有害音频的得分为:
S=W1SASR+W2SSVM+W3Smeta
通过设定一个阈值范围,得分超过该范围的音频定性为有害音频,不超过该设定阈值的音频定性为无害音频,最终完成有害音频的检测。
6.一种有害音频检测装置,其特征在于,包括:
关键词匹配模块,用于执行:输入语音数据进行连续语音关键词匹配,输出识别的文本内容,从关键词的角度检测待测音频中是否含有有害关键词;
SVM分类器,用于执行:基于关键词匹配模块获得的识别的文本内容,采用SVM分类器进行分类,;
元学习有害音频分类模块,用于执行:基于元学习进行有害音频分类网络,从文本意图的角度对待测样本进行分类;
得分融合模块,用于执行:对关键词匹配得分、SVM分类器得分、元学习分类网络得分进行融合,获得待测音频最终被检测为有害音频的得分S。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心,未经讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011092241.5/1.html,转载请声明来源钻瓜专利网。