[发明专利]检测生物分子的变化的方法和检测生物调控分子的变化的方法有效
申请号: | 201410003967.5 | 申请日: | 2014-01-03 |
公开(公告)号: | CN103729578B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 李雷;王琳 | 申请(专利权)人: | 中国科学院数学与系统科学研究院 |
主分类号: | G06F19/20 | 分类号: | G06F19/20 |
代理公司: | 北京润平知识产权代理有限公司11283 | 代理人: | 李婉婉,张苗 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 生物 分子 变化 方法 调控 | ||
技术领域
本发明涉及生物医药领域,具体地,涉及一种检测生物分子的变化的方法和一种检测生物调控分子的变化的方法。
背景技术
从DNA到蛋白质的过程称之为基因表达(gene expression),对这个过程的调节即为基因表达调控(regulation of gene expression or gene control)。基因调控是现代分子生物学研究的中心课题之一。因为要了解动植物生长发育规律、形态结构特征及生物学功能,就必须搞清楚基因表达调控的时间和空间概念,掌握了基因调控机制,就等于掌握了一把揭示生物学奥秘的钥匙。
测量细胞样本、组织样本等的全基因组表达值是功能性基因组学的首要问题。目前的测量技术包括生物芯片、RNA-seq等等,这些技术各有各的优点和缺点。虽然人们希望能够精确地测量出全基因组RNA表达值,但是由于每个技术的局限性,原始的测量值与真实值的误差和偏差不可避免。这就需要对这些原始的测量值做恰当的统计分析。生物芯片(biochip或bioarray)是根据生物分子间特异相互作用的原理,将生化分析过程集成于芯片表面,从而实现对DNA、RNA、多肽、蛋白质以及其他生物成分的高通量快速检测。狭义的生物芯片概念是指通过不同方法将生物分子(寡核苷酸、cDNA、genomic DNA、多肽、抗体、抗原等)固着于硅片、玻璃片(珠)、塑料片(珠)、凝胶、尼龙膜等固相递质上形成的生物分子点阵。
生物芯片能够高通量、自动化地检测基因的差异,包括cDNA水平上的差异和蛋白水平的差异,因而能够作为研究基因调控的手段之一。但是,生物芯片中的数据往往只能检测那些丰度高的效应生物分子(如在合成、代谢过程中的酶),而对于生物调控分子,如转录因子和microRNA,由于其在细胞中丰度低等原因,它们在生物事件中所发生的变化难以在生物芯片的数据中直接反映出来,由此降低了生物芯片数据的利用价值。
RNA-seq技术是近年来发展的一种新的全基因组RNA表达值的技术,它不需要预先设计探针,是与生物芯片互补的一种技术。
比较两个或多个细胞样本时,如果通过某种技术获得了它们之间无偏的基因表达差异数值,如何找到导致这些差异的调控机制则是功能性基因组学的一个核心问题。目前直接测量调控过程难度很大,利用调控分子如转录因子或microRNA与DNA的结合强度信息,在广义的中心法则下准确地推断调控机制是一个非常有挑战的计算生物学和生物信息学问题。对人类健康、农业发展、环境保护和能源发展有重要意义。
发明内容
为了提高生物芯片数据的利用价值,进一步有效地挖掘生物芯片数据中的有用信息,本发明提供了一种检测生物分子的变化的方法和一种检测生物调控分子的变化的方法。
根据本发明提供的检测生物分子的变化的方法,该方法包括:(1)用生物芯片或者高通量测序技术RNA-seq分别测量处理样品和对照样品,分别获得处理数据和对照数据;(2)使用对照数据对处理数据进行正规化,以获得无偏的基因表达差异数值;其中,在正规化中,在处理数据和对应的对照数据之间建立线性样条模型,用稳健统计估计法估计线性样条模型的参数,使用具有参数的线性样条模型校正处理数据中的数值,将校正后的数值作为正规化后的数值。
本发明还提供了一种检测生物调控分子的变化的方法,该方法包括:(1)根据如上所述的方法检测生物分子的变化,获得基因表达差异数值;(2)根据基因表达差异数值,将具有正表达差异值的差异基因和具有负表达差异值的差异基因分别作为分析对象,由差异基因的差异强度和生物调控分子与全体基因的结合强度来确定调控差异基因的生物调控分子的变化。
通过上述技术方案,本发明能够有效地挖掘生物芯片和RNA-seq数据中的有用信息,确定调控差异基因的生物调控分子的变化,并给出量化指标。
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
图1是正规化前后的数据M值的核密度图;
图2是本发明各个模块之间的关系示意图。
具体实施方式
以下对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院数学与系统科学研究院,未经中国科学院数学与系统科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410003967.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用