[发明专利]一种基于数据库分析的人工智能辅助诊断方法在审
申请号: | 202110731834.X | 申请日: | 2021-06-30 |
公开(公告)号: | CN113436745A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 朱婷;张伟;胡耀;袁敏兰 | 申请(专利权)人: | 四川大学华西医院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N20/00;G06K9/62;G06F40/30;G06F40/289;G06F16/33 |
代理公司: | 成都众恒智合专利代理事务所(普通合伙) 51239 | 代理人: | 王育信 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据库 分析 人工智能 辅助 诊断 方法 | ||
本发明公开了一种基于数据库分析的人工智能辅助诊断方法,包括以下步骤:S1:建立数据集,S2:将步骤S1中得到的数据集导入到机器学习模型中,得到多组分类预测结果;S3:将步骤S2中得到的多组分类预测结果进行评价。本发明融合了电子病历系统中的结构化数据和非结构化数据,实现了从患者个体多维度信息融合的角度构建人工智能辅助诊断方法,辅助诊断系统进行临床诊断决策,对获得的多组分类预测结果进行评价,保证预测结果的可靠性,具有很高的临床适用性和推广性。
技术领域
本发明涉及人工智能辅助诊断技术领域,特别是一种基于数据库分析的人工智能辅助诊断方法。
背景技术
随着医疗健康信息化的快速发展,医疗机构及各类医疗健康服务型企业会产生大量的医疗健康数据,包括医疗图像、电子病历、健康档案等,人工智能技术能够对这些医疗大数据进行语义分析和数据挖掘,并实现对部分疾病的早期预警或自动诊断。人工智能技术能够使得多级医疗机构和智慧医疗服务终端逐步达到电子信息化和智能化,便于实现优质医疗资源的扩大化利用。例如,人工智能辅助诊断可以将优质医疗资源的诊断经验下沉到社区或二级医院,扩充优质医疗资源的辐射范围和产能。为了对患者疾病更好的诊断,就需要借助到人工智能辅助诊断系统进行辅助处理。
目前的诊断系统在对患者就诊信息进行采样分析时,一方面采样方式简单,缺少采样关键词防错机制,容易造成医学名词的分离;通常基于医生经验进行分析,存在较大的主观性,在患者数量较大的情况下,无法同时对基本信息、住院信息、诊断信息、费用信息、生命体征数值和检查信息等关键信息进行全面有效的利用,且存在大量冗杂和无关信息,使得诊断时间较长,无法保证诊断系统的可靠性和准确性;此外,现有诊断系统不具备诊断结果评价的功能,数据可靠性无法验证。
发明内容
本发明的目的在于克服现有人工智能辅助诊断系统临床适用性较低、推广性较差的问题,提供一种基于数据库分析的人工智能辅助诊断方法。
一种基于数据库分析的人工智能辅助诊断方法,包括以下步骤:
S1:建立数据集,包括
S1.1将病人信息进行合并,形成样本集;
S1.2在样本集中输入主诉症状文本信息,形成数据库样本集;
S1.3对数据库样本集进行清洗和处理;
S1.4采用假设检验的方式对清洗和处理后的数据库样本集进行特征筛选,筛选出的显著变量构成数据集;
S1.5对数据集进行样本平衡;
S2:将步骤S1中得到的数据集导入到机器学习模型中,得到多组分类预测结果;
S3:将步骤S2中得到的多组分类预测结果进行评价。
进一步的,所述步骤S1.1中的病人信息包括基本信息、住院信息、诊断信息、费用信息、生命体征数值和检查信息。
进一步的,所述步骤S1.2的主诉症状文本信息处理方式为,运用自然语言分词方法,对记录患者主要症状和当前情绪状态的描述性文本数据(主诉)等非结构化数据进行了去除所有数字和标点符号处理;所述文本数据由R语言里的jieba包拆分成词,通过添加一些停用词、医学词典以及结合医生的人工经验,防止医学术语不被拆分,使得分词更为准确。
进一步的,所述步骤S1.3中对样本集进行清洗和处理的方式为数据删失、构造新变量、补充缺失数据、对数据进行分类和合并。
进一步的,所述步骤S1.5中的样本平衡方式为过采样和欠采样。
进一步的,所述步骤S2中采用的机器学习模型为支持向量机(SVM)算法、Logistics 回归算法、随机森林(RF)、XGBoost算法和LigthGBM算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学华西医院,未经四川大学华西医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110731834.X/2.html,转载请声明来源钻瓜专利网。