[发明专利]使用基于树的空间数据结构对基因数据集的群体分类在审
申请号: | 202010488467.0 | 申请日: | 2013-08-07 |
公开(公告)号: | CN111667885A | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | B·查克拉巴蒂;P·穆尼亚帕;S·库马尔;R·辛格;S·库马尔;A·马特胡尔 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B50/30;G06F16/901;G06F16/906 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 孟杰雄 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 基于 空间 数据结构 基因 数据 群体 分类 | ||
1.一种非暂态存储介质,其存储能由电子数据处理设备(10)运行以执行包括以下的方法的指令:
对表示参考群体的基因数据集的特征向量执行特征降维以生成将所述特征向量映射到与所述特征向量的维度相比维度降低的向量空间的映射;
使用所述映射来生成所述参考群体的所述基因数据集的维度降低的向量表示;
将所述参考群体的所述基因数据集的所述维度降低的向量表示存储为基于树的空间数据结构中的数据点;
利用与从其采集所述参考群体的所述基因数据集的对象有关的信息来标注所述基于树的空间数据结构中的所述数据点;并且
基于数据点的分布和所述数据点的标注将所述基于树的空间数据结构的空间区域与在所述参考群体内的群体相关联,
其中,所述方法还包括:
使用所述映射来生成先证者基因数据集的先证者维度降低的向量表示;
将所述先证者维度降低的向量表示定位在所述基于树的空间数据结构中;并且
基于所述先证者基因数据集在所述基于树的空间数据结构中的位置来对所述先证者基因数据集进行分类。
2.根据权利要求1所述的非暂态存储介质,其中,所述映射是线性变换。
3.根据权利要求1-2中的任一项所述的非暂态存储介质,其中,所述映射是Y=M(X),其中,X是表示基因数据集的特征向量,Y是所述基因数据集的所述维度降低的向量表示,并且M是变换矩阵。
4.根据权利要求1-3中的任一项所述的非暂态存储介质,其中,所述执行包括:
对表示所述参考群体的所述基因数据集的所述特征向量执行主成分分析(PCA)以生成所述映射。
5.根据权利要求1-4中的任一项所述的非暂态存储介质,其中,所述基于树的空间数据结构具有与所述参考群体的所述基因数据集的所述维度降低的向量表示的维度相等的维度。
6.根据权利要求1-4中的任一项所述的非暂态存储介质,其中,所述基于树的空间数据结构具有低于所述参考群体的所述基因数据集的所述维度降低的向量表示的维度的维度,并且所述存储包括:
将所述参考群体的所述基因数据集的所述维度降低的向量表示存储为数据点,所述数据点具有由少于所述参考群体的所述基因数据集的所述维度降低的向量表示的维数的全部的维数定义的坐标。
7.根据权利要求1-6中的任一项所述的非暂态存储介质,其中,所述基于树的空间数据结构是四叉树结构、八叉树结构、k-d树结构或UB树结构。
8.根据权利要求1-7中的任一项所述的非暂态存储介质,其中,所述方法还包括:
使用所述映射来生成不是所述参考群体的部分的新的基因数据集的新的维度降低的向量表示;并且
将所述新的维度降低的向量表示存储为所述基于树的空间数据结构中的新的数据点。
9.根据权利要求1所述的非暂态存储介质,其中,所述关联包括:
执行对由所述基于树的空间数据结构索引的所述空间中的所标注的数据点的聚类。
10.根据权利要求9所述的非暂态存储介质,其中,所述聚类是k中心点聚类。
11.一种用于对基因数据集进行分类的装置,包括:
如权利要求1-10中的任一项所述的非暂态存储介质;以及
电子数据处理设备(10),其被配置为读取并执行在所述非暂态存储介质上存储的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010488467.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种去除水中有机污染物的方法
- 下一篇:位置指示器