[发明专利]咳嗽疾病识别模型构建方法及应用在审
申请号: | 202210399616.5 | 申请日: | 2022-04-15 |
公开(公告)号: | CN114664438A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 孙文胜;缪梓萍;应娜 | 申请(专利权)人: | 杭州电子科技大学;浙江省疾病预防控制中心 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/50;G06K9/00;G06K9/62;G06N3/04;G06N3/08;A61B5/08;G10L25/30;G10L25/60 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 咳嗽 疾病 识别 模型 构建 方法 应用 | ||
1.咳嗽疾病识别模型构建方法,其特征在于:
1)采集咳嗽病人的咳嗽音频,分类别形成咳嗽数据库及标签;
2)对所有咳嗽音频进行预处理:
先对所有音频进行归一化、端点检测;
再进行数据整合,对于同一类标签中的音频数据进行计算得到声谱图;
对声谱图按照咳嗽疾病类别设置相应的标签;
3)声谱图后处理:进行多个尺度的高斯滤波,获得不同尺度下的声谱图,并采用线性加权增强咳嗽声的纹理;
4)将咳嗽音频样本对应的声谱图及咳嗽疾病标签输入双嵌套残差迁移网络ResNet32进行模型训练;
所述的双嵌套残差迁移网络ResNet32由5个双嵌套残差结构、1个64通道的7 x 7卷积核和1个全连接层组成;每个双嵌套残差结构由6个3 x 3卷积核构成,且每个卷积层的通道数相同;5个双嵌套残差结构的通道数分别为64、128、256、256、512;全连接层的输出维度为疾病种类,最后选用softmax分类函数识别咳嗽种类;
5)当训练至模型收敛时,以收敛的双嵌套ResNet32模型作为咳嗽疾病识别模型。
2.根据权利要求1所述的咳嗽疾病识别模型构建方法,其特征在于:对于同一类标签中的音频数据计算得到声谱图具体是:
对数据集中的每个咳嗽音频信号进行分帧、加窗的预处理;
然后进行短时离散傅里叶变化,得到频谱;
再以对数振幅描述来生成声谱图。
3.咳嗽疾病识别模型应用,其特征在于将权利要求1所构建的咳嗽疾病识别模型部署至服务器端。
4.根据权利要求3所述的应用,其特征在于:
S1.设计开发服务器后端与手机APP客户端,并按客户/服务器方式工作;
S2.当用户需要检测时,手持手机,打开手机APP客户端;当咳嗽发生时,身体产生震动,手机震动传感器感知并启动录音;
S3.手机录完音频后,随即自动上传给服务器端,服务器端收到此音频后,利用咳嗽疾病识别模型进行识别,从而得出其关联的疾病;
S4.服务器将得到的结果反馈给手机APP。
5.根据权利要求4所述的应用,其特征在于:当服务器将得到的结果反馈给手机APP时,若此时再产生咳嗽,则再次上传,用户可选择停止录音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学;浙江省疾病预防控制中心,未经杭州电子科技大学;浙江省疾病预防控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210399616.5/1.html,转载请声明来源钻瓜专利网。