[发明专利]声音场景的识别方法、装置、设备及存储介质在审
申请号: | 202010787183.1 | 申请日: | 2020-08-07 |
公开(公告)号: | CN112750448A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 李娟娟;夏咸军;朱鸿宁;王燕南;黄俊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/12;G10L25/18;G10L25/24;G10L25/30;G10L25/45 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 场景 识别 方法 装置 设备 存储 介质 | ||
1.一种声音场景的识别方法,其特征在于,所述方法包括:
获取音频信号;
对所述音频信号进行特征提取,得到音频特征;
根据所述音频特征对所述音频信号进行至少两级场景识别,得到至少两级场景识别结果,所述场景识别结果中包含不同场景类别对应的场景概率;
基于至少两级所述场景识别结果,确定所述音频信号对应的目标场景类别;
其中,不同级别场景识别结果中包含的场景类别不同,且对于第i级场景识别结果中的任意场景类别,第i+1级场景识别结果中存在与所述场景类别对应的父类场景类别,i为正整数。
2.根据权利要求1所述的方法,其特征在于,所述基于至少两级所述场景识别结果,确定所述音频信号对应的目标场景类别,包括:
获取第一级场景识别结果中候选场景类别对应的子类场景概率;
从所述第一级场景识别结果以外的场景识别结果中,获取所述候选场景类别对应的至少一级父类场景类别的父类场景概率;
根据所述子类场景概率和所述父类场景概率,确定所述候选场景类别对应的融合场景概率;
基于各个所述候选场景类别的所述融合场景概率,从所述候选场景类别中确定所述目标场景类别。
3.根据权利要求2所述的方法,其特征在于,所述从所述第一级场景识别结果以外的场景识别结果中,获取所述候选场景类别对应的至少一级父类场景类别的父类场景概率,包括:
确定第二级场景识别结果中所述候选场景类别对应的第一级父类场景类别,并获取所述第一级父类场景类别对应的所述父类场景概率;
确定第j级场景识别结果中的第j-1级父类场景类别,并获取所述第j-1级父类场景类别对应的所述父类场景概率,所述第j-1级父类场景类别为第j-2级父类场景类别对应的父类场景类别,j为大于等于2的整数。
4.根据权利要求2所述的方法,其特征在于,所述根据所述子类场景概率和所述父类场景概率,确定所述候选场景类别对应的融合场景概率,包括:
计算所述子类场景概率与所述父类场景概率的概率乘积;
将所述概率乘积确定为所述候选场景类别对应的所述融合场景概率;
所述基于各个所述候选场景类别的所述融合场景概率,从所述候选场景类别中确定所述目标场景类别,包括:
将最大融合场景概率对应的所述候选场景类别确定为所述目标场景类别。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述音频特征对所述音频信号进行至少两级场景识别,得到至少两级场景识别结果,包括:
将所述音频特征输入至少两级场景识别模型,得到至少两级所述场景识别模型输出的所述场景识别结果,其中,第i级场景识别模型用于根据所述音频特征输入所述第i级场景识别结果,所述场景识别模型是根据包含场景类别标签的样本音频信号训练得到的神经网络模型,且同一样本音频信号对应至少两级所述场景类别标签。
6.根据权利要求5所述的方法,其特征在于,所述将所述音频特征输入至少两级场景识别模型,得到至少两级所述场景识别模型输出的所述场景识别结果,包括:
将所述音频特征输入第一级场景识别模型,得到所述第一级场景识别模型输出的第一级场景识别结果;
响应于所述第一级场景识别结果不满足结果输出条件,将所述音频特征输入所述第一级场景识别模型以外的其它场景识别模型,得到其它场景识别模型输出的场景识别结果。
7.根据权利要求6所述的方法,其特征在于,所述结果输出条件包括如下至少一种:
所述第一级场景识别结果中的最高场景概率高于第一概率阈值;
所述第一级场景识别结果中前k个场景类别对应同一父类场景类别,其中,所述第一级场景识别结果中的场景类别根据所述场景概率的降序排序,k为大于等于2的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010787183.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频处理方法、装置及设备
- 下一篇:时钟门控单元及集成电路