[发明专利]目标疾病的药物组挖掘方法和装置、电子设备、存储介质在审
申请号: | 202210445230.3 | 申请日: | 2022-04-26 |
公开(公告)号: | CN114783616A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 张莲民;刘正锋;张婧霞;张功球;罗敏 | 申请(专利权)人: | 深圳市大数据研究院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H70/40;G06F16/35;G06F16/383 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 洪铭福 |
地址: | 518000 广东省深圳市龙岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 疾病 药物 挖掘 方法 装置 电子设备 存储 介质 | ||
本公开实施例提供目标疾病的药物组挖掘方法和装置、电子设备、存储介质,涉及人工智能技术领域。该目标疾病的药物组挖掘方法,包括:获取目标疾病的目标医疗数据;对药物组数据进行向量转换处理,得到药物组向量;根据处方数据、药物组向量得到目标句向量;根据用药频率数据得到住院时长频率分类数据;根据住院时长频率分类数据得到聚类参数信息,并对目标句向量进行聚类处理,得到聚类结果数据;根据聚类结果数据进行生存分析处理,得到生存曲线信息;根据生存曲线信息从药物组数据进行药物挖掘处理,得到针对目标疾病的目标药物组挖掘结果,通过本公开实施例提供的技术方案可以提升药物挖掘结果的有效性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种目标疾病的药物组挖掘方法和装置、电子设备、存储介质。
背景技术
当前针对创伤性脑损伤等疾病进行药物挖掘的方法主要包括以下两类:(1)基于数据模型的数据挖掘方法、(2)基于生存时间和生存状态的生存分析方法。
其中,当前的药物挖掘的方法(1)仍然停留在药物统计阶段,受文献收录处方影响较大,处方丰富度决定了数据库的完整性,比如,以临床症状为研究主体的药物挖掘方法,仅考虑了症状与药物对应关系和与症状对应的药物的使用频率,考虑的因素较为单一,导致药物挖掘结果的有效性较差;而数据模型存在着限制条件过于严格的缺陷,如要求样本数据服从多元正态分布、协方差矩阵相同等,这导致挖掘算法的运算效率受限;当前的药物挖掘的方法(2)只是考虑到生存时间与生存状态的关系,然后利用生存曲线表现生存概率,导致药物挖掘结果的有效性较差。
综上所述,当前的药物挖掘的方法存在着运算效率受限、药物挖掘结果的有效性较差的问题。
发明内容
本公开实施例的主要目的在于提出一种目标疾病的药物组挖掘方法和装置、电子设备、存储介质,能够提高药物挖掘算法的运算效率、提升药物挖掘结果的有效性。
为实现上述目的,本公开实施例的第一方面提出了一种目标疾病的药物组挖掘方法,包括:
获取目标疾病的目标医疗数据;所述目标医疗数据包括患者的药物组数据、处方数据、健康数据、用药频率数据,其中,所述健康数据包括住院时长数据、出院状态数据,所述药物组数据为包括至少两种药物数据的组合;
对所述药物组数据进行向量转换处理,得到药物组向量;
根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量;
根据所述用药频率数据对所述健康数据进行数据划分处理,得到住院时长频率分类数据;其中,所述住院时长频率分类数据包括高频率数据、低频率数据;
根据所述住院时长频率分类数据得到聚类参数信息;
根据所述聚类参数信息对所述目标句向量进行聚类处理,得到聚类结果数据;
根据所述聚类结果数据对每个所述药物组数据对应的所述住院时长频率分类数据进行生存分析处理,分别得到所述高频率数据和所述低频率数据对应的生存曲线信息;
根据所述生存曲线信息从所述药物组数据进行药物挖掘处理,得到针对所述目标疾病的目标药物组挖掘结果。
在一些实施例,所述获取目标疾病的目标医疗数据,包括:
获取所述目标疾病的原始医疗数据;
对所述原始医疗数据进行数据预处理,得到所述目标医疗数据;所述数据预处理包括针对同一出院状态病患数据的筛选处理、住院时长训练集划分处理、重复值处理、缺失值处理、异常值处理。
在一些实施例,所述对所述药物组数据进行向量转换处理,得到药物组向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大数据研究院,未经深圳市大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210445230.3/2.html,转载请声明来源钻瓜专利网。