[发明专利]一种基于数据库分析的人工智能辅助诊断方法在审
申请号: | 202110731834.X | 申请日: | 2021-06-30 |
公开(公告)号: | CN113436745A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 朱婷;张伟;胡耀;袁敏兰 | 申请(专利权)人: | 四川大学华西医院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N20/00;G06K9/62;G06F40/30;G06F40/289;G06F16/33 |
代理公司: | 成都众恒智合专利代理事务所(普通合伙) 51239 | 代理人: | 王育信 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据库 分析 人工智能 辅助 诊断 方法 | ||
1.一种基于数据库分析的人工智能辅助诊断方法,其特征在于:包括以下步骤:
S1:建立数据集,包括
S1.1将病人信息进行合并,形成样本集;
S1.2在样本集中对主诉症状文本信息进行处理,形成数据库样本集;
S1.3对数据库样本集进行清洗和处理;
S1.4采用假设检验的方式对清洗和处理后的数据库样本集进行特征筛选,筛选出的显著变量构成数据集;
S1.5对数据集进行样本平衡;
S2:将步骤S1中得到的数据集导入到机器学习模型中,得到多组分类预测结果;
S3:将步骤S2中得到的多组分类预测结果进行评价。
2.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S1.1中的病人信息包括基本信息、住院信息、诊断信息、费用信息、生命体征数值和检查信息。
3.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S1.2的主诉症状文本信息处理方式为,运用自然语言分词方法,对记录患者主要症状和当前情绪状态的描述性文本数据(主诉)等非结构化数据进行了去除所有数字和标点符号处理;所述文本数据由R语言里的jieba包拆分成词,通过添加一些停用词、医学词典以及结合医生的人工经验,防止医学术语不被拆分,使得分词更为准确。
4.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S1.3中对样本集进行清洗和处理的方式为数据删失、构造新变量、补充缺失数据、对数据进行分类和合并。
5.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S1.5中的样本平衡方式为过采样和欠采样。
6.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S2中采用的机器学习模型为支持向量机(SVM)算法、Logistics回归算法、随机森林(RF)、XGBoost算法和LigthGBM算法。
7.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S2中得到的多组分类预测结果进行评价,评价的参数包括正确率、错误率、真阳率、特异度、精度。
8.根据权利要求1所述的一种基于数据库分析的人工智能辅助诊断方法,其特征在于:所述步骤S2中还包括AUC评价和ROC评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学华西医院,未经四川大学华西医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110731834.X/1.html,转载请声明来源钻瓜专利网。