[发明专利]面向大规模高维序列数据的交互特征并行选择方法有效

专利信息
申请号: 201810575946.9 申请日: 2018-06-06
公开(公告)号: CN108897990B 公开(公告)日: 2021-10-29
发明(设计)人: 赵宇海;印莹;郭文鹏;王国仁;祁宏伟 申请(专利权)人: 东北大学
主分类号: G16B20/20 分类号: G16B20/20;G16B40/00;G06N3/00;G06K9/46
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 胡晓男
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 大规模 序列 数据 交互 特征 并行 选择 方法
【权利要求书】:

1.面向大规模高维序列数据的交互特征并行选择方法,其特征在于,包括:

对原始高维序列数据进行编码;所述原始高维序列数据是生物信息领域中的原始单核苷酸多态性Single Nucleotide Polymorphism,即SNP数据;

通过基于图论的块过滤,保留与目标类相关的SNP数据;

将与目标类相关的SNP数据执行细粒度的特征过滤;

划分特征过滤后的SNP数据集为若干块,并基于极大等位公共子序列MACS得到特征候选区域;

所述极大等位公共子序列MACS具体定义如下:

假设给定任意k条序列若序列Sα=eα1eα2…eαl,l≤min{n1,n2,...,nk},满足1≤i≤k,则称其为S1,S2,...,Sk的等位公共子序列;进一步,如果Sα的任意真超序列不是S1,S2,...,Sk的等位公共子序列,则称Sα为S1,S2,...,Sk的极大等位公共子序列MaximalAllelic CommonSubsequence,简称MACS;对候选区域对应的数据集基于MapReduce进行特征区域的多样性选择,得到代表性特征区域;

对代表性特征区域采用置换搜索的并行蚁群算法进行交互特征选择,得到显著性特征子集集合,即显著SNP位点集合。

2.根据权利要求l所述的面向大规模高维序列数据的交互特征并行选择方法,其特征在于,所述通过基于图论的块过滤,保留与目标类相关的编码后的SNP数据,包括:

对编码后的SNP数据进行基于图论的块过滤,构建无向权重图;

找出无向权重图中的密集子图,将与目标类相关的SNP数据保留。

3.根据权利要求2所述的面向大规模高维序列数据的交互特征并行选择方法,其特征在于,确定无向权重图中的密集子图,包括:

迭代地移除图中具有平均度数最小的顶点及相关的边并计算移除边后得到子图的密度,当子图顶点数量为1时迭代结束,将迭代过程中密度最大的子图作为密集子图输出。

4.根据权利要求l所述的面向大规模高维序列数据的交互特征并行选择方法,其特征在于,所述将与目标类相关的SNP数据执行细粒度的特征过滤,包括:

计算与目标类相关的SNP数据区域内的所有特征,按照其与目标类标签的卡方值降序排列;

计算所有卡方值的间隔区,确定间隔区最大值;

将间隔区最大值所对应的特征在SNP数据区域中所在位置作为削减阈值进行特征削减,得到特征过滤后的SNP数据集和特征。

5.根据权利要求l所述的面向大规模高维序列数据的交互特征并行选择方法,其特征在于,所述划分特征过滤后的SNP数据集为若干块,并基于极大等位公共子序列MACS得到特征候选区域,包括:

利用置换检验方法,确定特征过滤后的SNP数据集的支持度下界作为划分粒度;

基于极大等位公共子序列MACS,对特征过滤后的SNP数据集基于MapReduce并行划分成一系列低维序列数据,得到若干极大等位公共子序列构成的子序列集合作为区域划分后特征候选区域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810575946.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top