[发明专利]基于音频的用户状态识别方法、装置及存储介质在审
申请号: | 202011074898.9 | 申请日: | 2020-10-09 |
公开(公告)号: | CN112233700A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 魏文琦;王健宗;贾雪丽;张之勇;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/18;G10L25/27;G10L15/06;G10L15/20;G06N3/04;G06N3/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音频 用户 状态 识别 方法 装置 存储 介质 | ||
1.一种基于音频的用户状态识别方法,其特征在于,所述方法包括:
获取音频训练集,对所述音频训练集中的每个音频进行特征转换,得到目标声谱图集;
基于注意力机制与小样本学习,利用所述目标声谱图集对预构建的深度学习网络模型进行训练,得到用户状态识别模型;
当接收到待识别用户的音频时,对所述待识别用户的音频进行特征转换,得到待识别声谱图;
利用所述用户状态识别模型对所述待识别声谱图进行识别,得到用户状态识别结果。
2.如权利要求1所述的基于音频的用户状态识别方法,其特征在于,所述对所述音频训练集中的每个音频进行特征转换,得到目标声谱图集,包括:
将所述音频训练集中的每个音频进行重采样,得到对应的数字语音信号;
对所述数字语音信号进行预加重,得到标准数字语音信号;
汇总所有的所述标准数字语音信号,得到语音信号集;
对所述语音信号集中包含的每个标准数字语音信号进行特征转换,得到目标声谱图集。
3.如权利要求2所述的基于音频的用户状态识别方法,其特征在于,所述对所述语音信号集中包含的每个标准数字语音信号进行特征转换,得到目标声谱图集,包括:
利用预设声音处理算法,将所述语音信号集中的每个标准数字语音信号映射在频域,得到对应的目标声谱图;
汇总所有的所述目标声谱图得到所述目标声谱图集。
4.如权利要求1所述的基于音频的用户状态识别方法,其特征在于,所述利用所述目标声谱图集对预构建的深度学习网络模型进行训练,得到用户状态识别模型,包括:
将所述目标声谱图集随机划分为训练集及测试集;
利用所述训练集对所述深度学习网络模型进行训练得到初始识别模型;
根据所述测试集对所述初始识别模型进行测试得到损失值;
当所述损失值大于预设阈值时返回所述将所述目标声谱图集随机划分为训练集及测试集步骤;
当所述损失值小于或等于预设阈值时,将所述初始识别模型作为用户状态识别模型。
5.如权利要求4所述的基于音频的用户状态识别方法,其特征在于,所述将所述目标声谱图集随机划分为训练集及测试集,包括:
将所述目标声谱图集中的每个目标声谱图按照对应的初始标签进行分类,得到对应的分类目标声谱图集;
从所述分类目标声谱图集中随机取出预设数量的目标声谱图作为测试子集,将所述分类声谱图集中所述测试子集的补集作为训练子集;
汇总所有的所述训练子集得到训练集;
汇总所有的所述测试子集得到测试集。
6.如权利要求5所述的基于音频的初始标签识别方法,其特征在于,所述根据所述测试集对所述初始识别模型进行测试得到损失值,包括:
提取所述初始识别模型中每种所述初始标签对应的特征向量,得到目标特征向量;
利用所述初始识别模型对所述测试集中的每个目标声谱图进行特征提取,得到对应的测试特征向量;
计算每种所述初始标签对应的所述目标特征向量与所述测试特征向量的距离,得到损失距离值;
计算所有所述损失距离值的平均值,得到所述损失值。
7.如权利要求1至6中任何一项所述的基于音频的用户状态识别方法,其特征在于,所述音频训练集为不同的疾病情况对应的咳嗽音频的集合。
8.一种基于音频的用户状态识别装置,其特征在于,所述装置包括:
模型生成模块,用于获取音频训练集,对所述音频训练集中的每个音频进行特征转换,得到目标声谱图集;基于注意力机制与小样本学习,利用所述目标声谱图集对预构建的深度学习网络模型进行训练,得到用户状态识别模型;
状态识别模块,用于当接收到待识别用户的音频时,对所述待识别用户的音频进行特征转换,得到待识别声谱图;利用所述用户状态识别模型对所述待识别声谱图进行识别,得到用户状态识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011074898.9/1.html,转载请声明来源钻瓜专利网。