[发明专利]用于预测患有癌症的可能性或风险的方法和机器学习系统在审
申请号: | 201810588702.4 | 申请日: | 2018-06-08 |
公开(公告)号: | CN109036571A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | J·科恩;J·雷迪克;V·多塞耶娃;P·施;J·M·弗洛雷斯-费尔南德兹 | 申请(专利权)人: | 20/20基因系统股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/20;G06K9/62;G01N33/574 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 崔锡强 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类器 癌症 临床参数 计算机可读介质 机器学习系统 计算机执行 接收器操作 生物标志物 测量生物 非侵入性 患者群体 机器学习 使用机器 学习系统 训练数据 肿瘤抗原 标志物 灵敏度 评估 权重 子集 组群 关联 测试 分类 人群 预测 统计 | ||
1.计算机执行的用于预测患者患有癌症的可能性的方法,
该方法在计算机系统中进行,所述计算机系统具有一个或多个耦合至存储器的处理器,所述存储器储存由一个或多个处理器执行的一个或多个计算机可读指令,所述一个或多个计算机可读指令包含用于如下的指令:
储存包含多个患者记录的数据集,每个患者记录包括多个参数和相应的患者的值,且其中数据集还包括诊断指示符,其指示该患者是否被诊断为患有癌症;
选择输入的多个参数的子集进入机器学习系统,其中所述子集包括一组至少两种不同的生物标志物和至少一种临床参数;
将数据集随机分配为训练数据和验证数据;
使用机器学习系统基于训练数据和输入的子集生成分类器,其中每个输入值具有相关的权重;和
确定分类器是否满足预定的接收器操作者特征(ROC)统计值,从而指定灵敏度和特异性,以校正患者类别。
2.权利要求1的计算机执行的方法,还包括当所述机器学习系统满足预定的ROC统计值时,生成分类器的静态配置。
3.权利要求2的计算机执行的方法,还包括:
使用静态分类器配置用户可访问的计算装置;
使对应于患者的多个参数的子集的值进入计算装置;和
使用静态分类器将患者分类为指示患有癌症可能性的类别或指示不患有癌症的可能性的另一类别。
4.权利要求3的计算机执行的方法,还包括当患者被分类为指示剂患有癌症的可能性的类别时,向用户提供建议进行诊断测试的通知。
5.权利要求4的计算机执行的方法,还包括:
(1)从证实或否定存在癌症的诊断测试得到测试结果;
(2)将测试结果并入训练数据以进一步训练所述机器学习系统;和
(3)由所述机器学习系统生成改善的分类器。
6.权利要求1的计算机执行的方法,其中生物标志物的组选自:AFP、CA125、CA 15-3、CA19-19、CEA、CYFRA 21-1、HE-4、NSE、Pro-GRP、PSA、SCC、抗-细胞周期蛋白E2、抗-MAPKAPK3、抗-NY-ESO-1和抗-p53。
7.权利要求1的计算机执行的方法,其中所述分类器是神经网络、支持向量机,决策树,随机森林,神经网络或深度学习神经网络。
8.权利要求1的计算机执行的方法,其中所述分类器具有至少80%的特异性。
9.权利要求1的计算机执行的方法,其中所述癌症选自乳腺癌、胆管癌、骨癌、宫颈癌、结肠癌、结直肠癌、胆囊癌、肾癌、肝或肝细胞癌、小叶癌、肺癌、黑素瘤、卵巢癌、胰腺癌、前列腺癌、皮肤癌和睾丸癌。
10.计算机执行的评估患者相对于人群患有肺癌的可能性的方法,包括:
测量来自患者的样品中的生物标志物的组的值;
从患者得到临床参数;
利用由机器学习系统生成的分类器将患者分类为指示患有癌症的可能性的类别或指示不患有癌症的可能性的另一类别,其中分类器包含至少70%的灵敏度和至少80%的特异性,且其中使用包含至少两种不同生物标志物的生物标志物的组和至少一种临床参数生成分类器;和
当患者被分类为指示患有癌症的可能性的类别时,向用户提供进行诊断测试的通知。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于20/20基因系统股份有限公司,未经20/20基因系统股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810588702.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:超声科非病历内容的过滤方法及系统
- 下一篇:一种多数据库交互方法及装置