[发明专利]基于音频的用户状态识别方法、装置及存储介质在审
申请号: | 202011074898.9 | 申请日: | 2020-10-09 |
公开(公告)号: | CN112233700A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 魏文琦;王健宗;贾雪丽;张之勇;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/18;G10L25/27;G10L15/06;G10L15/20;G06N3/04;G06N3/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音频 用户 状态 识别 方法 装置 存储 介质 | ||
本发明涉及人工智能,揭露一种基于音频的用户状态识别方法,包括:对所述音频训练集中的每个音频进行特征转换,得到目标声谱图集;基于注意力机制与小样本学习,利用所述目标声谱图集对预构建的深度学习网络模型进行训练,得到用户状态识别模型;对所述待识别用户的音频进行特征转换,得到待识别声谱图;利用所述用户状态识别模型对所述待识别声谱图进行识别,得到用户状态识别结果。本发明实施例还涉及一种区块链技术,所述音频训练集可以存储在区块链中。本发明还提出一种基于音频的用户状态识别装置、电子设备以及计算机可读存储介质。本发明降低了数据资源消耗,增强了模型的实用性。
技术领域
本发明涉及人工智能领域,尤其涉及一种基于音频的用户状态识别方法、装置、电子设备及存储介质。
背景技术
随着智慧生活的理念逐渐普及,用户状态成为了智慧生活的核心关注点,因此用户状态的识别成为了一件非常重要的事情,如识别用户当前的健康状态,尤其在传染病大肆流行的时候,时刻了解每个人的健康状态很重要。一般情况下,需要用户到医院找医生进行身体检查才能了解其健康情况,医院本身就充满了各种病菌,去医院检查存在着被感染的风险。
目前,通常利用大量的用户的医学图像(如胸部X光)来训练机器学习模型实现用户状态识别来确定用户的健康状态,但是大量的用户的医学图像耗费了大量的数据资源,且用户的医学图像获取门槛较高导致实用性不强无法更好地推广普及。
发明内容
本发明提供一种基于音频的用户状态识别方法、装置、电子设备及计算机可读存储介质,其主要目的在于降低了数据资源消耗,增强了模型的实用性。
为实现上述目的,本发明提供的一种基于音频的用户状态识别方法,包括:
获取音频训练集,对所述音频训练集中的每个音频进行特征转换,得到目标声谱图集;
基于注意力机制与小样本学习,利用所述目标声谱图集对预构建的深度学习网络模型进行训练,得到用户状态识别模型;
当接收到待识别用户的音频时,对所述待识别用户的音频进行特征转换,得到待识别声谱图;
利用所述用户状态识别模型对所述待识别声谱图进行识别,得到用户状态识别结果。
可选地,所述对所述音频训练集中的每个音频进行特征转换,得到目标声谱图集,包括:
对所述音频训练集中的每个音频进行重采样,得到对应的数字语音信号;
对所述数字语音信号进行预加重,得到标准数字语音信号;
汇总所有的所述标准数字语音信号,得到语音信号集;
对所述语音信号集中包含的每个标准数字语音信号进行特征转换,得到目标声谱图集。
可选地,所述对所述语音信号集中包含的每个标准数字语音信号进行特征转换,得到目标声谱图集,包括:
利用预设声音处理算法,将所述语音信号集中的每个标准数字语音信号映射在频域,得到对应的目标声谱图;
汇总所有的所述目标声谱图得到所述目标声谱图集。
可选地,所述利用所述目标声谱图集对预构建的深度学习网络模型进行训练,得到用户状态识别模型,包括:
将所述目标声谱图集随机划分为训练集及测试集;
利用所述训练集对所述深度学习网络模型进行训练得到初始识别模型;
根据所述测试集对所述初始识别模型进行测试得到损失值;
当所述损失值大于预设阈值时返回所述将所述目标声谱图集随机划分为训练集及测试集步骤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011074898.9/2.html,转载请声明来源钻瓜专利网。