[发明专利]一种利用miRNA数据进行疾病预测模形构建的方法无效
申请号: | 201010545328.3 | 申请日: | 2010-11-15 |
公开(公告)号: | CN102324000A | 公开(公告)日: | 2012-01-18 |
发明(设计)人: | 曾华宗 | 申请(专利权)人: | 上海聚类生物科技有限公司 |
主分类号: | G06F19/12 | 分类号: | G06F19/12 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200333 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 mirna 数据 进行 疾病 预测 构建 方法 | ||
技术领域
本发明属于生物技术领域,涉及到miRNA数据及构建疾病预测模型两个方面。
背景技术
miRNA或称为MicroRNA,即微小核糖核酸,是一类由内源基因编码的长度约为22个核苷酸的非编码单链RNA(核糖核酸)分子,在动物和植物中广泛表达。miRNA的大小约为21-23个碱基,已经被鉴别的miRNA大多是由具有发夹结构的约70-90个碱基大小的单链RNA前体经过Dicer(核糖核酸酶III的一种)酶加工后生成,有5’磷酸基和3’羟基,定位于RNA前体的3’端或者5’端,广泛存在于高等生物细胞中。因之具有破坏目标特异性基因的转录产物或者诱导翻译抑制的功能,miRNA被认为在调控发育过程中有重要作用。
miRNA的作用机理区别于一般的mRNA(信使核糖核酸)降解机制。成熟的miRNA被引导进入沉默复合体(RISC)中,单链的miRNA已不完全互补的方式结合到mRNA的结合位点上,通过碱基的互补配对,抑制蛋白质的翻译,从而调控基因表达。这种机制的miRNA结合位点通常在mRNA的3’端非编码区段。
miRNA作为一种参与调控基因表达的分子,广泛作用于真核生物的生理、生化作用过程中,这些miRNAs调节了细胞生长,组织分化,因而与生命过程中发育、疾病有关。研究者们通过对基因组上miRNA的位点分析,显示其在发育和疾病中起了非常重要的作用。一系列的研究表明:miRNAs在细胞生长和凋亡,血细胞分化,同源异形盒基因调节,神经元的极性,胰岛素分泌,大脑形态形成,心脏发生,胚胎后期发育等过程中发挥重要作用,其生物及医学上的研究意义十分重要,对于新的miRNA基因的分析,可能发现新的参与器官形成、胚胎发育和生长的调节因子,促进对癌症等人类疾病发病机制的理解。
本发明设计了一种利用miRNA数据进行疾病预测模型构建的方法,通过对miRNA数据生物信息的分析及提取,为构建疾病模型等医学研究提供信息参考。
发明内容
本发明所述的一种利用miRNA数据进行疾病预测模形构建的方法,主要包括如下几个步骤:
步骤一、原始数据信息分析。
步骤二、构建DLDA分类器。
步骤三、记性LOOV性能评估。
步骤四、构建疾病预测模型。
附图说明
图1、本发明所述一种利用miRNA数据进行疾病预测模形构建方法的实施流程图。
具体实施方式
以下为本方法实施的具体步骤:
步骤一、原始数据信息分析。这里的原始数据来源于目标疾病的miRNA差异表达数据,将miRNA差异表达数据分为TAD和NA两个不同分组,差异筛选参数设置为:fold change>2,P<.01,FDR<.05。
步骤二、对步骤一中TAD和NA两个分组构建DLDA(diagonal lineardiscriminant analysis,对角线性判别式分析)分类器,利用MATLAB(一款实用的数据分析软件,http://www.mathworks.com/)软件中的统计工具箱(Statisticaltoolbox)中的一个函数classify进行分类处理。
步骤三、对步骤二中分类器处理结果,采用LOOV(leave one out crossvalidation,弃一法交叉验证)进行性能评估,可获得分类器的正确率、敏感度、特异性等数据。
步骤四、本方法适用于各类疾病预测的研究中,针对某种疾病的特征性miRNA差异表达现象,通过上述几个步骤,构建分类器模型,可用于对该种疾病的预测。
以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海聚类生物科技有限公司,未经上海聚类生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010545328.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置