[发明专利]基于机器学习技术的不同类型肿瘤对放疗射线敏感性的检测方法有效
申请号: | 202010803645.4 | 申请日: | 2020-08-11 |
公开(公告)号: | CN111951926B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 袁双虎;李玮;李莉;韩毅;刘宁;胡旭东;任晓霖;袁朔;吕慧颖;于金明 | 申请(专利权)人: | 山东省肿瘤防治研究院(山东省肿瘤医院);山东大学;济南比山网络科技有限公司 |
主分类号: | G16H20/40 | 分类号: | G16H20/40;G16H70/20;G06N20/00;G06K9/62 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 董涛 |
地址: | 250000 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 技术 不同类型 肿瘤 放疗 射线 敏感性 检测 方法 | ||
1.基于机器学习技术决策树算法的不同类型肿瘤对放疗射线敏感性的检测方法,其特征在于,对医疗案例数据库内的非数字型特征数据进行处理,转变为数字型,并随机选取一定比例的数据作为模型训练数据,剩余的数据作为模型测试数据,而后将处理后的模型训练数据输入到决策树C4.5算法生成决策树模型T;对决策树进行剪枝处理直到损失函数不再减小,最终得到修剪后的决策树Tα;使用测试数据数据集对决策树剪枝得到的模型Tα进行验证,如果预测效果达到要求则输出Tα,如果未达到要求,则重复上述步骤,直到预测精度达到目标要求,而后输出Tα;根据决策树验证得到的Tα模型得到的相关特征Ai,输入病人相应的特征;将决策树Tα模型在Ai输入下的计算得到的肿瘤对不同射线的敏感性结果输出,
所述决策树C4.5算法是根据来自案例数据预处理模块的训练集D,生成决策树模型T,具体包括以下步骤:
步骤1:计算训练集D每个特征A的信息增益比,公式如下:
其中g(D,A)表示特征A对训练集D的信息增益,HA(D)表示训练集D关于特征A的值的熵,g表示特征个数;
步骤2:选择信息增益比最大的特征Ag,作为第一个划分特征;
步骤3:对特征A的取值进行升序排序得到集合An=[a1,a2,a3,a4…an],
步骤4:对集合A进行划分,得到新的集合T=[T1,T2,T3…Ta],公式如下:
步骤5:求训练集D的熵Ent(D),公式如下:
其中n表示训练集D的样本个数,xk表示第k个病人所用射线的编号,
步骤6:求样本集D基于特征A划分点T的信息增益g(D,A,Ts),公式如下:
步骤7:选择g(D,A,Ts)最大的节点作为特征A的划分节点;
步骤8:重复以上步骤,当特征的信息增益比小于阈值的时候设置为叶节点,得到决策树模型T。
2.根据权利要求1所述的方法,其特征在于,所述决策树验证为使用测试数据数据集对决策树剪枝模块得到的模型Tα进行验证,如果预测效果达到要求则输出Tα,如果未达到要求,则重复上述步骤,直到预测精度达到目标要求,而后输出Tα。
3.根据权利要求1所述的方法,其特征在于,随机选取70%比例的数据作为模型训练数据,剩余30%数据作为模型测试数据,所述损失函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省肿瘤防治研究院(山东省肿瘤医院);山东大学;济南比山网络科技有限公司,未经山东省肿瘤防治研究院(山东省肿瘤医院);山东大学;济南比山网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010803645.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吊装装置
- 下一篇:一种储氢材料用复合催化剂及其制备方法