[发明专利]辅助分析方法和装置、计算机可读存储介质、电子设备在审
申请号: | 202111664224.9 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114334138A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 王伟 | 申请(专利权)人: | 天津开心生活科技有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06K9/62 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 301800 天津市宝坻区天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助 分析 方法 装置 计算机 可读 存储 介质 电子设备 | ||
1.一种辅助分析方法,其特征在于,包括:
获取阳性样本以及阴性样本,对所述阴性样本数据进行补充,得到样本集;
对所述样本集中的用户数据进行预处理,得到特征数据,对所述特征数据进行筛选,得到目标特征字段;
获取所述样本集中的训练集,利用所述训练集中与所述目标特征字段对应的目标特征数据对预设分类器进行训练,得到目标分类器;
通过所述目标分类器得到目标用户的分析结果。
2.根据权利要求1所述的辅助分析方法,其特征在于,获取阳性样本以及阴性样本,对所述阴性样本数据进行补充,得到样本集,包括:
获取并将病历数据库中诊断结果为确诊目标疾病的用户数据作为阳性样本;
获取并将所述病历数据库中诊断结果为疑似目标疾病的用户数据作为阴性样本;
在确定所述阴性样本的数量少于预设样本数量时,获取诊断结果为确诊第二疾病的用户数据;
通过所述阳性样本、所述阴性样本以及所述诊断结果为确诊第二疾病的用户数据,得到样本集。
3.根据权利要求2所述的辅助分析方法,其特征在于,获取并将所述病历数据库中诊断结果为疑似目标疾病的用户数据作为阴性样本数据,包括:
获取所述病历数据库中包括的诊断结果为疑似目标疾病的第一用户;
获取所述第一用户的家系成员,在确定所述第一用户的家系成员未确诊目标疾病时,将所述第一用户的用户数据作为阴性样本数据。
4.根据权利要求1所述的辅助分析方法,其特征在于,对所述样本集中的用户数据进行预处理,得到特征数据,包括:
获取所述样本集中包括的用户数据;
在确定所述用户数据中包括结构化数据时,通过预设关键词对所述结构化数据进行筛选,得到筛选结果;
在确定所述用户数据中包括非结构化数据时,通过自然语言处理对所述非结构化数据进行提取,得到提取结果;
获取所述用户数据中包括的诊断结果,根据国际疾病分类对所述诊断结果进行统一,得到目标疾病的统一名称;
获取预设的病历报告表,基于所述病例报告表中包括的特征字段,通过所述筛选结果、所述提取结果以及所述目标疾病的统一名称得到特征数据。
5.根据权利要求4所述的辅助分析方法,其特征在于,对所述特征数据进行筛选,得到目标特征字段,包括:
获取所述病例报告表中与每一特征字段对应的特征数据;
通过卡方检验,得到所述病历报告中与每一特征字段对应的特征数据和所述目标疾病阳性变量的卡方值,以及所述卡方值的概率值;
当所述卡方值的概率值大于预设概率值时,过滤掉与所述卡方值对应的特征字段,得到目标特征字段。
6.根据权利要求1所述的辅助分析方法,其特征在于,获取所述样本集中的训练集,包括:
通过K折交叉验证或者样本的年份对所述样本集进行划分,得到训练集以及测试集。
7.根据权利要求6所述的辅助分析方法,其特征在于,利用所述训练集中与所述目标特征字段对应的目标特征数据对预设分类器进行训练,得到目标分类器,包括:
获取所述训练集中与所述目标特征字段对应的目标特征数据,通过所述目标特征数据对所述预设分类器进行训练得到辅助分类器;
将所述测试集中包括的与所述目标特征字段对应的目标特征数据输入至所述辅助分类器,得到预测结果,通过所述测试结果对所述辅助分类器进行评价;
在确定所述辅助分类器的评价指标高于预设评价指标时,将所述辅助分类器作为所述目标分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津开心生活科技有限公司,未经天津开心生活科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111664224.9/1.html,转载请声明来源钻瓜专利网。