[发明专利]一种基于深度学习的肺部声音诊断装置有效
申请号: | 202110088348.0 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112863667B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 陈石;李文钧;岳克强;王超;李宇航;张汝林;沈皓哲 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06F18/243;G06F18/2131;G06F18/10;G06N3/0464;G06N3/047;G06N3/048;G06N3/084;A61B7/00;A61B7/04 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 杨小凡 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 肺部 声音 诊断 装置 | ||
1.一种基于深度学习的肺部声音诊断装置,包括采集设备和深度学习分类模型,其特征在于还包括图像标注工具、数据预处理模块和二次数据增强模块,所述图像标注工具分别与采集设备和数据预处理模块连接,所述二次数据增强模块分别与数据预处理模块和深度学习分类模型连接;
所述采集设备,分别采集肺部健康状况正常和异常的肺部听诊数据;
所述图像标注工具,对所采集到的每段音频进行划分和标注;
所述数据预处理模块和二次数据增强模块,对所采集到的音频信号样本进行预处理,并做数据增强,得到不同肺部听诊信号样本的音频初级特征,归类并标记为正常样本和异常样本,用于后续进一步的深度学习特征提取;
所述深度学习分类模型,根据输入的正常听诊信号和异常听诊信号的初级特征向量,进行训练,得到一系列高层特征,采用RF分类器代替代替softmax分类层进行分类,通过输入的高层特征,得到多分类RF模型。
2.如权利要求1所述的一种基于深度学习的肺部声音诊断装置,其特征在于所述数据预处理模块,先进行长音频数据分段,再对每段做分帧、加窗以及短时傅里叶变换,X(n)是一个长序列,W(n)是长度为N的窗函数,用W(n)给X(n)加窗,得到N点序列Y(n),即Y(n)=X(n)W(n),而频域上则有:
其中,j表示虚轴单位,w表示角频率,θ表示偏移相位,采用帧移,使前后两帧在首尾处有交叉重叠釆用不同的窗函数降低频谱泄漏,在一次傅里叶变换过程中,采用一个固定的窗函数,使该窗函数两侧旁瓣的高度接近零,使能量大部分集中在主瓣。
3.如权利要求2所述的一种基于深度学习的肺部声音诊断装置,其特征在于所述窗函数采用汉宁窗,窗函数如下:
W(n)=0.5[1-cos(2πn/(M+1))];1≤n≤M
采用短时傅里叶变换对原始音频进行分析,将窗函数加在一段连续非平稳的信号上,并随着时间移动窗口,使原信号变成一个个短时平稳信号,然后再对这些短时平稳信号作傅里叶变换,短时傅里叶变换的公式如下:
其中,s(t)为原信号,γ(t)为窗函数,τ表示不同于t的变量,对于离散的数字信号,其短时傅里叶变换公式如下:
其中,m表示第m个离散信号,n表示第n个离散信号,k表示离散信号个数,L表示离散信号长度。
4.如权利要求1所述的一种基于深度学习的肺部声音诊断装置,其特征在于所述二次数据增强模块,对原始音频数据集进行第一次数据增强,增强包括音频旋转、音量变化、音频加噪;
音频旋转:将音频文件中后一段数据截取拼接到开头,得到一组新的数据序列;
音量变化:将音频信号的音量按原始音频的倍数变换,得到新数据;
音频加噪:往音频中加入随机噪声数据,得到新数据;
对第一次增强后的音频数据进行频谱分析,包括分帧、加窗、傅里叶变换、梅尔滤波、取对数运算,得到音频文件对应的语谱图,将音频数据转化为语谱图数据后,进行第二次数据增强,采用随机均值替换法产生新的语谱图数据,实现数据增强;
随机选取行列:通过随机方式选取每个语谱图中部分行与部分列;
均值替换:计算每个语谱图中二维数据的平均值,用均值替换掉随机选取的行列数据,得到新的语谱图数据;
数据保存:对每个语谱图重复多次随机选取行列和均值替换的操作,得到多组新的语谱图数据,加入到原数据集中,完成第二次数据增强。
5.如权利要求1所述的一种基于深度学习的肺部声音诊断装置,其特征在于所述初级特征的提取,对信号进行FFT变换:
其中,xi(m)表示第m个信号,X(i,k)表示信号的频谱,则信号的短时幅度谱表示为|X(i,k)|,能量密度函数表示为P(i,k)=|X(i,k)|2,对其进行伪彩色映射,得到的二维图像,即谱图,同时反映时域和频域信息,再通过FFT和窗移得到正常音频和异常音频的谱图,
谱图的窗长和窗移参数的确定由最终分类效果决定,通过控制输入谱图尺寸不变,训练集和测试集的比例也相同,分别把几组不同的FFT和窗移参数随机组合得到的谱图输入深度学习分类模型,最终确定的FFT和窗移参数组合即为分类准确率最高的那组的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110088348.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于冬季的矿渣多孔材料连续制备装置
- 下一篇:仓库管理系统