[发明专利]有害音频识别解码方法及装置在审
申请号: | 202011092988.0 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112466281A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 李鹏;石瑾;张震;孙晓晨;杨晶超;宁珊;冯象雷;倪江帆 | 申请(专利权)人: | 讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L19/00;G06F16/35;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有害 音频 识别 解码 方法 装置 | ||
本发明公开了有害音频识别解码方法及装置,该方法包括:获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果。本发明通过对声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果,通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,提高有害音频识别解码的准确率。
技术领域
本发明涉及一种有害音频识别解码方法及装置,属于音频识别技术领域。
背景技术
而目前大量的有害音频文件意图会被刻意的伪装,与有害音频有关的名词及采取的各类活动会借用其它词来替代,仅从字面上理解是很难与有害活动关联起来的,导致有害音频这类正例样本难以收集。相对海量的音频文件,有害音频的数量几乎可以忽略不计,而且需要大量有专业经验的Z察人员从海量音频数据中人工进行甄别、筛选,耗时长且工作量大,样本获取难度大。基于网络安全监管的需要,急需设计有害音频识别解码方法和装置方案解决有害音频文件的识别解码。
发明内容
本发明的目的在于,克服现有技术存在的技术缺陷,解决上述技术问题,提出有害音频识别解码方法及装置。
本发明具体采用如下技术方案:有害音频识别解码方法,包括:
获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;
将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;
将所述文本集合分类结果输入声学模型中输出解码结果。
作为一种较佳的实施例,所述有害音频分类网络模型的训练方法如下:
设计一个大数据量的意图分类网络称之为基分类器g(x;θ),设计一个参数回归映射网络F(.);给定大数据量的意图分类网络k-shot的标注样本,进行普通的分类训练,得到参数θk,其中k=1,2,…,2n;参数回归映射网络作用:元学习当样本集增大时基分类器参数的映射关系f(θk)=θk+1,训练的目标函数为:
通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,来指导小样本(VT,VF)条件下有害音频的分类网络的学习。
作为一种较佳的实施例,所述将所述文本集合分类结果输入声学模型中输出解码结果具体包括:
将所述文本集合分类结果分别输入各个环境无关的声学模型中得到各个声学模型的第一轮解码结果;结合所述文本集合分类结果、所述第一轮解码结果以及各个不同声学单元的声学模型进行环境自适应分别得到对应的各个不同声学单元的环境自适应后的声学模型;使用所述各个不同声学单元的环境自适应后的声学模型对所述文本集合分类结果分别解码,得到第二轮解码结果;对所述第二轮解码结果使用投票的方法以得到最终解码结果。
作为一种较佳的实施例,所述进行环境自适应包括:
冻结环境无关的声学模型的全部参数,在所述环境无关的声学模型的第一个隐层后添加一个线性缩放层,初始化参数包括设置为1;
使用CTC准则对所述线性缩放层进行优化,其中,优化后的模型即为针对测试环境自适应后的声学模型。
作为一种较佳的实施例,所述声学模型包括单音素声学模型、三音素声学模型和字符声学模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心,未经讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011092988.0/2.html,转载请声明来源钻瓜专利网。