[发明专利]基于神经网络模型的COPD诊断信息敏感数据挖掘方法在审
申请号: | 202110832878.1 | 申请日: | 2021-07-22 |
公开(公告)号: | CN113555127A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 卢剑伟 | 申请(专利权)人: | 常州工业职业技术学院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F21/62;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 丁博寒 |
地址: | 212300 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 模型 copd 诊断 信息 敏感数据 挖掘 方法 | ||
本发明涉及数据挖掘技术领域,尤其涉及基于神经网络模型的COPD诊断信息敏感数据挖掘方法,采用无监督进步式学习算法对COPD诊断信息进行清洗,消除重复记录的数据,通过支持向量机构建立COPD诊断信息敏感数据挖掘模型,神经网络模型对COPD诊断信息敏感数据挖掘模型进行自动求解和参数自动调优,从而实现COPD诊断信息敏感数据自动挖掘。该方法通过无监督进步式的学习算法对COPD诊断信息敏感数据进行清洗,以神经网络模型优化支持向量机模型,实现最优分界函数自动求解和参数自动调优,可以自动地记录、处理未标记的、大量的数据记录,更加有效地发挥数据挖掘过程中的潜在价值,提高了查全率,缩短了消耗的时间,提高了错误数据的检测率。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及基于神经网络模型的COPD诊断信息敏感数据挖掘方法。
背景技术
数据挖掘技术是指采用统计学、在线分析处理、可视化技术、机器学习、模式识别等诸多方法,从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中搜索隐藏信息的过程,将数据挖掘技术应用到COPD诊断信息数据中,可以明确其中的诊断规则和模式,从而辅助医生进行COPD的明确诊断。
现有技术中,公开了基于熵权法和主成分分析融合的敏感数据挖掘方法,该方法在敏感数据的基础上确定建模所用的指标,结合主成分分析法和熵权法对敏感数据进行挖掘,该方法没有对敏感数据进行清洗,导致挖掘敏感数据所需的时间较长,存在挖掘效率低的问题;还公开了基于序列格的敏感数据挖掘方法,该方法首先利用最长路径的策略对原始数据库进行截断处理,在此基础上,采用表连接操作生成满足差分隐私的序列格,利用序列格结构本身的特性对敏感数据进行挖掘,该方法获取的数据完整性较差,导致敏感数据的查全率较低;还公开了一种利用主题聚类的敏感数据挖掘方法,该方法采用LDA主题模型对数据进行主题聚类,再通过K-means++对以天为单位的数据聚类,最后采用IMi挖掘的过程模型自动求解,通过合规性检查对敏感数据进行挖掘,该方法在挖掘到的数据中检测出的错误数据过少,降低了错误数据检测率。
鉴于上述问题的存在,本发明人基于从事此类产品工程应用多年丰富的实务经验及专业知识,积极加以研究创新,以期创设基于神经网络模型的COPD诊断信息敏感数据挖掘方法,使其更具有实用性。
发明内容
本发明所要解决的技术问题是:提供基于神经网络模型的COPD诊断信息敏感数据挖掘方法,提高查全率,缩短消耗的时间,提高错误数据的检测率。
为了达到上述目的,本发明所采用的技术方案是:基于神经网络模型的COPD诊断信息敏感数据挖掘方法,所述方法包括以下步骤:
S1、采用无监督进步式学习算法对COPD诊断信息进行清洗,消除重复记录的数据;
S2、通过支持向量机构建立COPD诊断信息敏感数据挖掘模型;
S3、神经网络模型对COPD诊断信息敏感数据挖掘模型进行自动求解和参数自动调优,从而实现COPD诊断信息敏感数据自动挖掘。
进一步地,步骤S1中,对数据的清洗包括以下步骤:
得到原始数据后,先对数据集进行预处理,再选择合适的属性;
找到合适的聚类算法和分类方法再去分组记录;
采用数据挖掘技术进行相似度的计算;
采用无监督步进式学习算法对诊断信息中相似的数据进行清理。
进一步地,所述无监督进步式学习算法采用竞争学习,所述竞争学习由互相竞争的中性细胞组成,其所述中性细胞的应用规则描述为:
E(N)=a/2-Φ(wTx) (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州工业职业技术学院,未经常州工业职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110832878.1/2.html,转载请声明来源钻瓜专利网。