[发明专利]特征量选择方法、特征量选择程序、多类分类方法、多类分类程序、特征量选择装置、多类分类装置及特征量集在审

专利信息
申请号: 202180014238.8 申请日: 2021-02-05
公开(公告)号: CN115104028A 公开(公告)日: 2022-09-23
发明(设计)人: 长濑雅也 申请(专利权)人: 富士胶片株式会社
主分类号: G01N33/50 分类号: G01N33/50;G06F16/906;G06T7/00;G06N20/00;G16B40/20
代理公司: 永新专利商标代理有限公司 72002 代理人: 徐殿军
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 特征 选择 方法 程序 分类 装置
【说明书】:

本发明的目的在于提供一种选择特征量并且根据所选择的特征量的值将样品分类为多个类中的任一个的多类分类方法、多类分类程序、多类分类装置、以及用于这样的多类分类的特征量选择方法、特征量选择装置及特征量集。在本发明中,处理伴随特征量选择的多类分类问题。特征量选择是预先按照字面意思对样品所具备的大量的特征量中的用于后续的各处理(在本发明中尤其是多类分类)所需的特征量进行取舍选择的方法。多类分类是确定给定的未知样品属于多个类中的哪一个的判别问题。

技术领域

本发明涉及一种选择特征量并且根据所选择的特征量的值将样品分类为多个类中的任一个的多类分类方法、多类分类程序、多类分类装置、以及用于这样的多类分类的特征量选择方法、特征量选择装置及特征量集。

背景技术

近年来,机器学习在产业领域中的应用或展开取得了进展,但特征选择及多类分类仍然是大课题。存在各种特征选择的方法,但提出了关注类的成对耦合的事例(参考下述“非专利文献1”)。具体而言,非专利文献1中记载的技术是关注基本的类分类为类数2个的“二进制类分类”,进行类的成对耦合,关注并选择特征量的判别能力的方法。

并且,作为多类分类的方法,例如已知有重复进行2类判别的OVO方式(One-Versus-One:一对一)。

并且,例如在生物领域中,也以癌等为对象,积极地研究了特征选择及多类分类的方法。大体上是通常的机器学习方法的应用,例如,适用了基于t检验或信息增益等的特征选择的方法、基于SVM(Support Vector Machine:支持向量机)、随机森林、朴素贝叶斯等的分类方法。这样的技术例如记载于专利文献1中。

以往技术文献

非专利文献

非专利文献1:“Feature selection for multi-class classification usingpairwise class discriminatory measure and covering concept”,Hyeon Ji等,ELECTRONICS LETTERS,16th March 2000,vol.36,No.6,p.524-525

专利文献

专利文献1:日本特表2012-505453号公报

发明内容

发明要解决的技术课题

非专利文献1中记载的研究仅停留特征选择,在后续的多类分类中直接使用现有的方法。并且,关于本发明,未明示如后述的对集合覆盖问题的扩展。并且,未进行用于选择稳健性的特征量的特征量之间的独立性的验证等,而且,仅假设基本的多类分类,也未导入不需要判别的类等。因此,难以直接适用于扩展性多类分类。同样地,在专利文献1中记载的技术中,也未考虑将判别所需的基因组作为集合覆盖问题进行详查。

并且,在重复进行2类判别来进行多类分类的方法中,在投票法中已指出“上位的排序不可信”的问题。并且,在淘汰层级法中已指出“难以确定比较顺序”的问题。

在生物领域中的特征量选择及多类分类的情况下,在报告多的基于mRNA表达水平的事例中,存在“当处理类数达到10左右时,精度下降”的课题。例如,在根据突变信息开发的多类癌分类器的报告之一中,结果为超过F值0.70,能够判别的癌有5种。还研究了基于DNA甲基化的特征选择及多类分类。然而,适用类停留在少量的小规模的样品尺寸的试验。

近年来,也出现应用深层学习的研究,但由于组学数据本身的欠定性,学习无法顺利进行(相对于参数数,样品尺寸小;相对于存在几十万处甲基化位置,能够获得的肿瘤记录即使是开放数据也小于1万个),假设即使成功,例如在诊断用途等中,由于无法明确判别的理由,因此也存在难以接受的课题。

如此,现有技术中,无法根据所选择的一部分的特征量的值将具有多个特征量的样品稳健且高精度地分类为多个类中的任一个。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士胶片株式会社,未经富士胶片株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202180014238.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top