[发明专利]通过偏差校正和分类预测生成生物标记签名的系统和方法有效

专利信息
申请号: 201380039806.5 申请日: 2013-06-21
公开(公告)号: CN104508671B 公开(公告)日: 2018-10-19
发明(设计)人: 弗洛里安·马丁;向阳 申请(专利权)人: 菲利普莫里斯生产公司
主分类号: G06F19/24 分类号: G06F19/24
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 宋岩
地址: 瑞士纳*** 国省代码: 瑞士;CH
权利要求书: 查看更多 说明书: 查看更多
摘要: 本文详述了用于按集成方式校正数据集并对数据集进行分类的系统和方法。训练数据集、训练分类集和测试数据集被接收。对于所述训练数据集,通过将机器学习技术应用到训练数据集和训练分类集来生成第一分类器,并且通过根据第一分类器对测试数据集中的元素进行分类来生成第一测试分类集。对于多次迭代中的每一次,训练数据集被变换,测试数据集被变换,并且通过将机器学习技术应用到经变换的训练数据集来生成第二分类器。根据第二分类器来生成第二测试分类集,并且将第一测试分类集与第二测试分类集相比较。
搜索关键词: 用于 通过 集成 偏差 校正 分类 预测 生成 生物 标记 签名 系统 方法
【主权项】:
1.一种由处理器运行的将数据集分类到两个或更多个分类的计算机实现的方法,包括:(a)接收训练数据集和训练分类集,所述训练数据集的元素表示患病病人、对疾病有抵抗力的病人或未患病病人的基因表达数据,所述训练分类集包括已知标签的集合,各已知标签标识与所述训练数据集中的每个元素相关联的分类;(b)接收测试数据集;(c)通过将第一机器学习技术应用到所述训练数据集和所述训练分类集来生成用于所述训练数据集的第一分类器;(d)通过根据所述第一分类器对所述测试数据集中的元素进行分类来生成第一测试分类集;(e)通过将所述训练数据集中的元素移动与训练分类质心的集合的中心相对应的量来变换所述训练数据集,其中各训练分类质心代表所述训练数据集中的元素的子集的中心;以及(f)对于多次迭代中的每一次:(i)通过将所述测试数据集中的元素移动与测试分类质心的集合的中心相对应的量来变换所述测试数据集,其中各测试分类质心代表所述测试数据集中的元素的子集的中心;(ii)通过根据第二分类器对经变换的测试数据集中的元素进行分类来生成第二测试分类集,其中所述第二分类器是通过将第二机器学习技术应用到经变换的训练数据集和所述训练分类集而生成的;(iii)当所述第一测试分类集与所述第二测试分类集不同时,将所述第二测试分类集存储为所述第一测试分类集并将所述经变换的测试数据集存储为所述测试数据集并且返回步骤(i)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菲利普莫里斯生产公司,未经菲利普莫里斯生产公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201380039806.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top