[发明专利]基于音频的用户状态识别方法、装置及存储介质在审

申请号：	202011074898.9	申请日：	2020-10-09
公开（公告）号：	CN112233700A	公开（公告）日：	2021-01-15
发明（设计）人：	魏文琦;王健宗;贾雪丽;张之勇;程宁	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L25/66	分类号：	G10L25/66;G10L25/18;G10L25/27;G10L15/06;G10L15/20;G06N3/04;G06N3/08
代理公司：	深圳市沃德知识产权代理事务所(普通合伙) 44347	代理人：	高杰;于志光
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于音频用户状态识别方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能，揭露一种基于音频的用户状态识别方法，包括：对所述音频训练集中的每个音频进行特征转换，得到目标声谱图集；基于注意力机制与小样本学习，利用所述目标声谱图集对预构建的深度学习网络模型进行训练，得到用户状态识别模型；对所述待识别用户的音频进行特征转换，得到待识别声谱图；利用所述用户状态识别模型对所述待识别声谱图进行识别，得到用户状态识别结果。本发明实施例还涉及一种区块链技术，所述音频训练集可以存储在区块链中。本发明还提出一种基于音频的用户状态识别装置、电子设备以及计算机可读存储介质。本发明降低了数据资源消耗，增强了模型的实用性。

技术领域

本发明涉及人工智能领域，尤其涉及一种基于音频的用户状态识别方法、装置、电子设备及存储介质。

背景技术

随着智慧生活的理念逐渐普及，用户状态成为了智慧生活的核心关注点，因此用户状态的识别成为了一件非常重要的事情，如识别用户当前的健康状态，尤其在传染病大肆流行的时候，时刻了解每个人的健康状态很重要。一般情况下，需要用户到医院找医生进行身体检查才能了解其健康情况，医院本身就充满了各种病菌，去医院检查存在着被感染的风险。

目前，通常利用大量的用户的医学图像(如胸部X光)来训练机器学习模型实现用户状态识别来确定用户的健康状态，但是大量的用户的医学图像耗费了大量的数据资源，且用户的医学图像获取门槛较高导致实用性不强无法更好地推广普及。

发明内容

本发明提供一种基于音频的用户状态识别方法、装置、电子设备及计算机可读存储介质，其主要目的在于降低了数据资源消耗，增强了模型的实用性。

为实现上述目的，本发明提供的一种基于音频的用户状态识别方法，包括：

获取音频训练集，对所述音频训练集中的每个音频进行特征转换，得到目标声谱图集；

基于注意力机制与小样本学习，利用所述目标声谱图集对预构建的深度学习网络模型进行训练，得到用户状态识别模型；

当接收到待识别用户的音频时，对所述待识别用户的音频进行特征转换，得到待识别声谱图；

利用所述用户状态识别模型对所述待识别声谱图进行识别，得到用户状态识别结果。

可选地，所述对所述音频训练集中的每个音频进行特征转换，得到目标声谱图集，包括：

对所述音频训练集中的每个音频进行重采样，得到对应的数字语音信号；

对所述数字语音信号进行预加重，得到标准数字语音信号；

汇总所有的所述标准数字语音信号，得到语音信号集；