[发明专利]基于机器学习的药品市场规模预测系统有效
申请号: | 202110739439.6 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113362116B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 朱仁;卓绮雯;李晓彤;劳丽玫 | 申请(专利权)人: | 深圳市全药网科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/00 |
代理公司: | 深圳市圳博友邦专利代理事务所(普通合伙) 44600 | 代理人: | 陈烈军 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 药品 市场规模 预测 系统 | ||
1.一种基于机器学习的药品市场规模预测系统,其特征在于,包括以下步骤:
S1、数据需求:根据用户提出的药品市场规模预测方面的需求,若已有历史的建模经验,则结合历史的建模经验和问题解决方案,整合形成综合的数据需求;
S2、采购量相关数据:依据药品市场规模预测方面的数据需求,从药品交易数据库中调取报量相关数据,并存于结构化的标准数据表中;
S3、数据清洗:对数据进行标记,并将有效的数据纳入模型;
S4、数据纳入否:对不纳入模型的数据进行数据检查,深入发现其不符合纳入模型标准的原因,挖掘其可能存在的数据问题;对纳入模型的数据进行多维度统计;
S5、多维度统计:对纳入模型的数据,从药品属性、医院属性、市场竞争、销量售价等方面进行多维度统计;
S6、指标库:将各个地区多维度统计的结果结构化,并存储于指标标准数据库中;
S7、随机分组:按照一定的分配比例,根据医疗机构的唯一编码,将部分医疗机构的数据划分为测试集,剩余医疗机构的数据划分为训练集,用于模型拟合;
S8、评估变量重要性:采用随机森林模型评估全部自变量的重要性,对于预测药品采购量的回归问题,采用均方误差增率(%IncMSE)作为自变量的重要性评价指标;对于预测采购量倍率评级的分类问题,采用平均准确率降幅(Mean Decrease Accuracy,MDA)评价自变量的重要性;
S9、预测模型搭建,包括以下步骤:
1)结合S8中自变量的重要性评价结果,对自变量按重要性指标降序排序,得到自变量集合F{x1,x2,x3,…},循环过程中,依次取F中的前i位元素,使得每次循环,取fi中的所有元素作为搭建模型的自变量组合;
2)对于预测药品采购量的回归问题,采用随机森林回归器和岭回归模型,进行回归分析,同时在时间序列资料完整时,采用时间序列分析方法优化模型;对于预测采购量倍率评级的分类问题,采用随机森林分类器模型,进行聚类分析;
3)调整部分模型中的参数,并评估模型的拟合优度或准确率,输出预测模型;
S10、是否历遍所有变量:检查循环是否历遍了训练集中的所有自变量,若未历遍所有自变量,则继续循环过程;若已历遍所有自变量,则结束循环,在预测模型集中根据拟合优度或准确率筛选最优模型;
S11、模型评估;
S12、专家评价:相关领域专家根据相关经验和参考资料,对模型的预测结果进行评价分析,提出修改建议,并评估其实用性;
S13、实用性判别:当预测模型未达到实用阶段时,则根据修改建议与评估结果,返回至数据需求生成阶段,指导下一步模型搭建方案;当预测模型达到实用阶段时,则存储于预测模型数据库中;
S14、真实环境测试;
S15、是否重新评估:根据真实环境测试结果,判断模型是否需要再评估,若需要再评估则返回至模型评估阶段,并根据专家评价结果修改建模方案,重新进入下一个建模阶段;若无需要再评估则将预测模型纳入到药品交易监测系统。
2.如权利要求1所述的基于机器学习的药品市场规模预测系统,其特征在于,所述步骤S3中,包括以下步骤:
1)将待清洗数据中无效订单数据、未知来源数据、错误数据等无效数据进行无效化标记;
2)利用药品编码,关联已搭建的药品信息标准库,对药品的目录通用名、目录剂型、标准规格、标准厂家名、基药、医保、限定日剂量等属性进行标记;
3)利用医院编码,关联已搭建的医疗机构信息标准库,对医疗机构的等级评级、行政区域、基层分类等属性进行标记;
4)对所有必要的字段制定缺失值补充的规则,补充规则亦随着建模过程中发现的问题反馈进行更新完善,结合补充规则,对待清洗数据进行缺失值补充;
5)结合纳入标准,对于无效数据、必要字段无法补充、不在统计时间范围内数据,或者建模经验认为需排除的其他数据等,标记为不纳入模型的数据,其他的数据则标记为纳入模型的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市全药网科技有限公司,未经深圳市全药网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110739439.6/1.html,转载请声明来源钻瓜专利网。