[发明专利]数据分析装置、方法以及程序在审
申请号: | 201680068222.4 | 申请日: | 2016-11-21 |
公开(公告)号: | CN108369666A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 山本博之 | 申请(专利权)人: | 福满代谢组技术有限公司 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06F17/15;G06F19/24 |
代理公司: | 上海立群专利代理事务所(普通合伙) 31291 | 代理人: | 杨楷;毛立群 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 数据分析装置 统计 统计数据 核矩阵 组信息 运算处理 数据项 偏最小二乘法 多变量分析 规定条件 记录管理 矩阵元素 样本计算 存储部 存储 | ||
1.一种数据分析装置,对多个统计样本进行有关多个数据项目的多变量分析,具备:
存储部,记录管理每个所述统计样本的所述多个数据项目的统计数据以及表示多个统计样本所形成的组排列的顺序的组信息;
控制部,基于所述统计数据以及所述组信息,进行规定的运算处理,
所述控制部基于所述统计数据而计算核矩阵,所述核矩阵中,矩阵元素表示与所述多个统计样本内的行号对应的统计样本以及与列号对应的统计样本之间的规定关系,
基于由所述核矩阵与所述组信息限定的规定条件下的偏最小二乘法进行运算处理,对所述多个统计样本计算分数。
2.如权利要求1所述的数据分析装置,所述存储部管理所述统计数据中的每个所述统计样本的多个种类的测量数据,所述控制部生成与所述每个种类的测量数据有关的核矩阵,基于所述每个种类的核矩阵的平均,计算整合后的核矩阵。
3.如权利要求1或权利要求2所述的数据分析装置,所述规定的关系由核函数限定,所述核函数基于所述统计数据内的与所述行号对应的统计样本有关的数据和与所述列号对应的统计样本有关的数据而得到。
4.如权利要求1~3中的任一项所述的数据分析装置,所述分数根据所述组信息所示出的组的顺序而增加或者减少。
5.如权利要求1~4中的任一项所述的数据分析装置,所述控制部分析所述统计数据中的每个数据项目的数据与计算的分数之间的相关性。
6.如权利要求1~5中的任一项所述的数据分析装置,所述规定条件包括:
第1条件,对与所述偏最小二乘法的说明变量以及目标变量中的说明变量相关联的第1向量,将所述第1向量彼此的经由所述核矩阵的内积设定为规定值;
第2条件,对与所述目标变量相关联的第2向量,根据基于所述组信息的规定惩罚项,使所述第2向量的大小从规定值偏移。
7.如权利要求1~6中的任一项所述的数据分析装置,所述统计数据包括将生物体内的多个代谢物作为数据项目的代谢组数据。
8.如权利要求1~7中的任一项所述的数据分析装置,所述统计数据包括示出与菌丛的基因序列有关的信息的宏基因组数据。
9.如权利要求1~8中的任一项所述的数据分析装置,所述统计数据包括通过同一生物体内的组学分析或计量化学得到的数据。
10.一种数据分析方法,是计算机对多个统计样本进行有关所述多个数据项目的多变量分析的数据分析方法,
在所述计算机的存储部记录有管理所述每个统计样本的所述多个数据项目的统计数据以及表示多个统计样本所形成的组排列的顺序的组信息,
包括如下步骤:
所述计算机,基于所述统计数据而计算核矩阵,在所述核矩阵中,矩阵要素表示与所述多个统计样本内的行号对应的统计样本以及与列号对应的统计样本之间的规定关系;
所述计算机,基于由所述核矩阵与所述组信息所限定的规定条件下的偏最小二乘法进行运算处理,对所述多个统计样本计算分数。
11.一种程序,用于使计算机执行权利要求10所述的数据分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福满代谢组技术有限公司,未经福满代谢组技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680068222.4/1.html,转载请声明来源钻瓜专利网。