[发明专利]鼾声识别方法、装置、计算机设备及计算机可读存储介质在审
申请号: | 202210806649.7 | 申请日: | 2022-07-08 |
公开(公告)号: | CN115171723A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵磊;谢棒;胡跃华;管建军 | 申请(专利权)人: | 博瑞佳影(北京)科技有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/51 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 王新哲 |
地址: | 100176 北京市北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 鼾声 识别 方法 装置 计算机 设备 可读 存储 介质 | ||
本发明公开了一种鼾声识别方法、装置、计算机设备及计算机可读存储介质,涉及声音识别领域。所述方法包括:计算机设备获取用户在睡眠期间的声音数据,将声音数据输入至预设神经网络的第一卷积模块,以得到第一特征输出;同时,对声音数据频谱化处理,并将频谱化处理结果输入至预设神经网络的第二卷积模块,得到第二特征输出;随后,将第一特征输出和第二特征输出拼接,得到融合特征输出;最后,控制预设神经网络的分类模块基于融合特征输出进行鼾声预测,得到声音对应的鼾声识别结果。基于此,本发明实施例中的实现了声音数据在不同维度的特征提取,使得声音数据对应的特征表达更为丰富,进而分类模块能根据丰富的特征完成高精度的鼾声识别。
技术领域
本发明涉及声音识别领域,尤其涉及一种鼾声识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
现有的鼾声识别中,大多为通过判断真实鼾声的特征与用户在睡眠时发出的声音信号的特征,如持续时间、间歇时间、呼吸频率及间歇期等特征是否匹配来实现。
但鼾声特征的选取极其依赖经验,且针对于不同年龄段或不同睡眠环境下的用户群体,用户对应的鼾声特征存在差异,导致一种鼾声识别方式难以应用到多类用户群体,使得鼾声识别方法的效率和精度均较低。
发明内容
有鉴于此,本发明提供一种鼾声识别方法、装置、计算机设备及计算机可读存储介质,以改善鼾声识别方法的效率和精度均较低的现状。
第一方面,本发明实施例提供一种鼾声识别方法,包括:
获取用户在睡眠期间的声音数据;
将所述声音数据输入至预设神经网络的第一卷积模块,得到第一特征输出;
对所述声音数据进行频谱化处理,并将频谱化处理结果输入至所述预设神经网络的第二卷积模块,得到第二特征输出;
将所述第一特征输出和所述第二特征输出拼接,得到融合特征输出;
利用所述预设神经网络的分类模块对所述融合特征输出进行预测,得到所述声音对应的鼾声识别结果。
可选的,在本发明实施例提供的一种可行方式中,所述第一卷积模块包括依次连接的多个第一卷积子模块和全局平均池化层,所述第一卷积子模块包括依次连接的一维卷积层、第一激活函数层、批量归一化层及第一最大池化层;
所述将所述声音数据输入至预设神经网络的第一卷积模块,得到第一特征输出,包括:
将所述声音数据输入至所述多个第一卷积子模块,以逐步进行特征提取、线性激活、归一化及降维处理,得到数据特征表示;
利用所述全局平均池化层对所述数据特征表示进行下采样,得到第一特征输出。
可选的,在本发明实施例提供的一种可行方式中,所述对所述声音数据进行频谱化处理,并将频谱化处理结果输入至所述预设神经网络的第二卷积模块,得到第二特征输出,包括:
基于梅尔频率倒谱系数对所述声音数据进行处理,得到频谱特征输出;
将所述频谱特征输出输入至所述预设神经网络的第二卷积模块,得到第二特征输出。
进一步的,在本发明实施例提供的一种可行方式中,所述第二卷积模块包括依次相连的多个第二卷积子模块,所述第二卷积子模块包括依次连接的二维卷积层、第二激活函数层及第二最大池化层;
所述将所述频谱特征输出输入至所述预设神经网络的第二卷积模块,得到第二特征输出,包括:
将所述频谱特征输出输入至所述依次相连的多个第二卷积子模块,以进行逐步卷积和池化,得到第二特征输出。
可选的,在本发明实施例提供的一种可行方式中,所述将所述第一特征输出和所述第二特征输出拼接,得到融合特征输出,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博瑞佳影(北京)科技有限公司,未经博瑞佳影(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210806649.7/2.html,转载请声明来源钻瓜专利网。