[发明专利]一种基于间隙谱的生物序列分析方法无效
申请号: | 200810057200.5 | 申请日: | 2008-01-30 |
公开(公告)号: | CN101497924A | 公开(公告)日: | 2009-08-05 |
发明(设计)人: | 安冬;苏谦 | 申请(专利权)人: | 中国农业大学 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F19/00 |
代理公司: | 北京路浩知识产权代理有限公司 | 代理人: | 王朋飞 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 间隙 生物 序列 分析 方法 | ||
1、一种生物序列的分析方法,其特征在于,该方法包括如下步骤:
(1)、计算生物序列的间隙谱:计算生物序列中字符之间的距离,分别统计字符之间相同距离的出现频率,构成间隙谱;
(2)、计算不同生物序列间的相似度;
(3)、推导不同生物序列的同源性或生物学功能:根据步骤(2)计算得到的相似度,如果相似性高,则推导这些生物序列之间可能具有同源性,或可能具有相似的生物学功能。
2、如权利要求1所述的分析方法,其特征在于,所述的步骤(1)后还包括如下步骤:①将间隙谱中的频率数据进行归一化,得到归一化后的频率数据;②计算间隙谱中频率最大值、最小值、均值、中位值、方差中的一种或多种;③将步骤①②得到的数据依次排列组合成一个特征向量,表示一条生物序列,再用线性相关系数或距离法计算不同生物序列间的相似度。
3、如权利要求2所述的分析方法,其特征在于,所述的步骤(1)还包括统计归一化后的间隙谱中字符相同距离出现的频率值的高低或者差别,如果在不同生物序列的间隙谱中,某一字符对的某一频率值都较高,则这一字符对是这些生物序列的一种相似序列模式;如果这一频率值在不同生物序列中差别较大,则这一频率值对应的字符对是这些生物序列的一种差别序列模式。
4、如权利要求3所述的分析方法,其特征在于,所述的步骤②还包括计算间隙谱中出现频率最大值、最小值时字符之间的距离。
5、如权利要求1-4任一所述的分析方法,其特征在于,所述的计算生物序列中字符之间的距离的方法包括如下步骤:
在用一维坐标标识的长度为n的生物序列中,沿正链方向或反链方向找到第一次出现某特定字符的坐标;
沿着该方向找到第二次、第三次、直至第p(p≤n)次出现某特定字符的坐标;
不重复计算任意两坐标间的坐标差,即可得到个字符与字符之间的距离数据。
6、如权利要求1-5任一所述的分析方法,其特征在于,所述的统计字符之间相同距离的出现频率的方法包括如下步骤:
设两字符i与j之间的距离为dij,dij=1,2,...,max;把两字符之间的距离dij进行升序或降序排列,分别统计相同距离的出现频率,得max维向量;对每个max维向量,选其S(S≤max)维子向量,构成间隙谱。
7、如权利要求1-6任一所述的分析方法,其特征在于,所述的距离是指在用一维坐标标识的生物序列中两个字符之间的坐标差。
8、如权利要求1-7任一所述的分析方法,其特征在于,所述的计算生物序列中字符之间的距离包括计算生物序列中一种或多种相同字符之间的距离和/或一种或多种不同字符之间的距离。
9、如权利要求8所述的分析方法,其特征在于,所述的统计字符之间相同距离出现的频率包括统计一种或多种相同字符之间相同距离出现的频率和/或统计一种或多种不同字符之间相同距离出现的频率。
10、权利要求1-9任一所述的分析方法在推导不同生物序列间的生物学关系的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810057200.5/1.html,转载请声明来源钻瓜专利网。