[发明专利]一种面向SNP数据的筛选方法无效
申请号: | 201110413777.7 | 申请日: | 2011-12-13 |
公开(公告)号: | CN102567652A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 吴悦;张文宾;雷州;刘宗田;吴红霞 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F19/10 | 分类号: | G06F19/10 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明一种面向SNP数据的筛选方法。本方法操作步骤如下:首先利用单个SNP的作用和SNP之间的相互作用计算SNP分类权重;其次利用支持向量机筛选单核苷酸多态性位点。本发明一种面向SNP数据的筛选方法,不仅考虑了单个SNP的作用,还充分考察了SNP之间的相互作用,提高了与疾病相关SNP筛选的可靠性。 | ||
搜索关键词: | 一种 面向 snp 数据 筛选 方法 | ||
【主权项】:
一种面向SNP数据的筛选方法,其特征在于具体操作步骤如下:首先,利用单个SNP的作用和SNP之间的相互作用计算SNP分类权重,具体步骤如下: (1)初始化SNP数据集和SNP的分类权重,将其分别设为N和0; (2)从实验数据集N中选择第i个样本,若i>N就结束,把当前分类权重值当作最终权重值,否则继续; (3)找到i样本的同类别的最近邻样本m和不同类别的最近邻样本n,样本类别只有正常和患病两种状态; (4)计算位点j处i样本和同类别最近邻样本之间的距离和不同类别最近邻样本之间的距离; (5)循环累加计算SNP位点j的分类权重,其中权重计算表达式如下: Wj:=Wj‑mute1(j,Si,m)+mute2(j,Si,n);其中Wj表示SNP位点j的分类权重,mute1(j,Si,m)表示SNP位点j处该样本和同类别最近邻样本之间的距离,mute2(j,Si,n)表示SNP位点j处该样本和不同类别最近邻样本之间的距离; 其次,利用支持向量机筛选单核苷酸多态性位点: (6)利用冒泡排序法对各个SNP的分类权重进行排序,并得到排序表(k1>k2>k3>....>kn); (7)顺序向后选择SNP位点组合Ki={ k1,k2,....ki},开始i=1; (8)利用支持向量机计算分类准确率; (9)判定分类准确率accuracy(Ki)是否大于给定的参数值λ,若大于等于则结束,否则i加1,转向步骤(7); (10)输出与疾病相关的的关键SNP组合; (11)筛选结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110413777.7/,转载请声明来源钻瓜专利网。
- 上一篇:变压器低压侧出线引线装置
- 下一篇:单指旋转手势检测方法及手势检测电路
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置