[发明专利]有害音频识别解码方法及装置在审
申请号: | 202011092988.0 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112466281A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 李鹏;石瑾;张震;孙晓晨;杨晶超;宁珊;冯象雷;倪江帆 | 申请(专利权)人: | 讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L19/00;G06F16/35;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有害 音频 识别 解码 方法 装置 | ||
1.有害音频识别解码方法,其特征在于,包括:
获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;
将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;
将所述文本集合分类结果输入声学模型中输出解码结果。
2.根据权利要求1所述的有害音频识别解码方法,其特征在于,所述有害音频分类网络模型的训练方法如下:
设计一个大数据量的意图分类网络称之为基分类器g(x;θ),设计一个参数回归映射网络F(.);给定大数据量的意图分类网络k-shot的标注样本,进行普通的分类训练,得到参数θk,其中k=1,2,…,2n;参数回归映射网络作用:元学习当样本集增大时基分类器参数的映射关系f(θk)=θk+1,训练的目标函数为:
通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,来指导小样本(VT,VF)条件下有害音频的分类网络的学习。
3.根据权利要求1所述的有害音频识别解码方法,其特征在于,所述将所述文本集合分类结果输入声学模型中输出解码结果具体包括:
将所述文本集合分类结果分别输入各个环境无关的声学模型中得到各个声学模型的第一轮解码结果;结合所述文本集合分类结果、所述第一轮解码结果以及各个不同声学单元的声学模型进行环境自适应分别得到对应的各个不同声学单元的环境自适应后的声学模型;使用所述各个不同声学单元的环境自适应后的声学模型对所述文本集合分类结果分别解码,得到第二轮解码结果;对所述第二轮解码结果使用投票的方法以得到最终解码结果。
4.根据权利要求3所述的有害音频识别解码方法,其特征在于,所述进行环境自适应包括:
冻结环境无关的声学模型的全部参数,在所述环境无关的声学模型的第一个隐层后添加一个线性缩放层,初始化参数包括设置为1;
使用CTC准则对所述线性缩放层进行优化,其中,优化后的模型即为针对测试环境自适应后的声学模型。
5.根据权利要求3所述的有害音频识别解码方法,其特征在于,所述声学模型包括单音素声学模型、三音素声学模型和字符声学模型;
所述对所述第二轮解码结果使用投票的方法以得到最终解码结果包括:将所述单音素声学模型的第二轮解码结果和所述三音素声学模型的第二轮识别结果进行对齐得到第一对齐序列;将所述第一对齐序列与所述字符声学模型的第二解码结果进行对齐得到第二对齐序列;基于所述第二对齐序列在各个声学模型的第二轮结果上进行投票,得到最终解码结果。
6.有害音频识别解码装置,其特征在于,包括:
特征提取模块,用于执行:获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;
有害音频分类模块,用于执行:将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;
解码模块,用于执行:将所述文本集合分类结果输入声学模型中输出解码结果。
7.根据权利要求6所述的有害音频识别解码装置,其特征在于,所述有害音频分类网络模型的训练方法如下:
设计一个大数据量的意图分类网络称之为基分类器g(x;θ),设计一个参数回归映射网络F(.);给定大数据量的意图分类网络k-shot的标注样本,进行普通的分类训练,得到参数θk,其中k=1,2,…,2n;参数回归映射网络作用:元学习当样本集增大时基分类器参数的映射关系f(θk)=θk+1,训练的目标函数为:
通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,来指导小样本(VT,VF)条件下有害音频的分类网络的学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心,未经讯飞智元信息科技有限公司;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011092988.0/1.html,转载请声明来源钻瓜专利网。