[发明专利]一种在染色体上定位并显示生物基因表达信息及环境敏感区域的方法有效

专利信息
申请号: 201410395461.3 申请日: 2014-08-12
公开(公告)号: CN104182656A 公开(公告)日: 2014-12-03
发明(设计)人: 马宝山;杨存敏;高英;徐丹;董辉;孙野青 申请(专利权)人: 大连海事大学
主分类号: G06F19/20 分类号: G06F19/20
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 贾汉生;李馨
地址: 116026 *** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 染色体 定位 显示 生物 基因 表达 信息 环境 敏感区域 方法
【权利要求书】:

1.一种在染色体上定位显示生物基因表达信息及环境敏感区域的方法,包括以下步骤:

(a)从NCBI公共数据库下载生物染色体基因组序列;

(b)读入相应生物样本基因表达芯片数据,所述基因表达芯片数据包括来自实验环境条件下的受试组样品和对照组样品的基因组基因的绝对表达量,将同一基因在受试组和对照组中的绝对表达量相除可获得该基因的基因表达倍数比值;所述对照组为在非实验环境条件下的样品;

(c)将基因表达倍数比值数据以2为底数求对数值;

(d)将步骤(c)得到的所有基因表达倍数比值数据的对数值进行归一化处理得环境条件值:将对数值大于等于1的基因的环境条件值规定为1,对数值小于等于-1的基因的环境条件值规定为-1,对数值大于-1小于1的基因的环境条件值与对数值相同;

(e)将基因表达芯片数据矩阵中的基因名字与步骤(a)中下载的生物染色体基因序列中基因名字相匹配,匹配成功后,将步骤(d)得到的所有基因的环境条件值定位到生物体基因组序列中对应基因位置上;

(f)根据定位到生物体基因组序列中对应基因位置上的环境条件值,划定实验环境条件下的基因界定条件,得生物染色体基因组上基因表达图像;

其中,环境条件值为1的染色体基因的位置填充红色,表示在实验环境条件下的上调基因;环境条件值为-1的染色体基因的位置填充蓝色,表示在实验环境条件下的下调基因;环境条件值大于-1小于1的染色体基因位置填充白色,表示在实验环境条件下的未见异常基因,未能匹配成功的染色体基因位置填充灰色,表示在实验环境条件下的未能匹配成功基因;

(g)根据染色体基因组上基因表达图像,判断环境敏感区域,所述判断环境敏感区域的标准为:同一染色体上连续三个或三个以上被标记为红色或者蓝色的区域被推测为环境敏感区域。

2.根据权利要求1所述的方法,其特征在于,所述步骤(f)还包括,统计和计算染色体基因中上调基因、下调基因、未见异常基因、未能匹配成功基因的数量和比例的步骤。

3.根据权利要求1所述的方法,其特征在于,所述步骤(g)还包括,统计和记录所有环境敏感区域基因的名称、在染色体上的绝对位置以及在基因表达图像中的相对位置的步骤。

4.根据权利要求1所述的方法,其特征在于,所述步骤(g)还包括,按照基因在染色体上的先后顺序导出环境敏感区域基因的基因表达芯片数据的步骤。

5.一种在染色体上定位显示生物基因表达信息及环境敏感区域的系统,该系统包括:

生物染色体基因信息下载单元,用于从NCBI公共数据库下载生物染色体基因组序列;

基因表达数据处理单元,用于读入相应生物样本基因表达芯片数据,并通过对照处理模块、对数处理模块和归一化处理模块处理读入的基因表达芯片数据,由此划定实验环境条件下的基因界定条件;所述基因表达芯片数据包括来自实验环境条件下的受试组样品和对照组样品的基因组基因的绝对表达量,所述对照组为在非实验环境条件下的样品;

所述对照处理模块,用于对所述基因表达芯片数据中的同一基因在受试组和对照组中的绝对表达量相除获得该基因的基因表达倍数比值;

所述对数处理模块,用于将所述基因表达倍数比值数据以2为底数求对数值;

所述归一化处理模块,用于对数处理单元得到的所有基因表达倍数比值数据的对数值得环境条件值:将对数值大于等于1的基因的环境条件值规定为1,对数值小于等于-1的基因的环境条件值规定为-1,对数值大于-1小于1的基因的环境条件值与对数值相同;

基因信息加载匹配单元,用于将基因芯片表达数据矩阵中的基因名字与下载的生物染色体基因组序列中基因名字相匹配,匹配成功后,将环境条件值定位到生物体基因组序列中对应基因位置上;

生成文件单元,包括4个功能模块:

(1)生成染色体上基因表达信息图像模块,用于根据定位到生物体基因组序列中对应基因位置上的环境条件值,得生物染色体基因组上基因表达图像;其中,环境条件值为1的染色体基因的位置填充红色,表示在实验环境条件下的上调基因;环境条件值为-1的染色体基因的位置填充蓝色,表示在实验环境条件下的下调基因;环境条件值大于-1小于1的染色体基因位置填充白色,表示在实验环境条件下的未见异常基因,未能匹配成功的染色体基因位置填充灰色,表示在实验环境条件下的未能匹配成功基因;

(2)生成不同变化模式的基因统计文件模块,用于计算将通过基因信息加载匹配模块匹配完成的染色体上的上调基因、下调基因、未见异常基因、未能匹配成功基因的数量和比例,将输出存储到.txt文件中;

(3)生成环境敏感区域基因信息统计文件模块,用于根据基因组上基因表达图像,判断环境敏感区域,记录所有环境敏感区域基因的名称,在染色体上的绝对位置以及在基因表达图像中的相对位置后,将所述信息输出储存到.txt文件中;所述判断环境敏感区域的标准为:同一基因组上连续三个或三个以上被标记为红色或者蓝色的区域被推测为环境敏感区域;

(4)生成环境敏感区域基因原始信息导出文件模块,用于将环境敏感区域基因的基因表达芯片数据按照在染色体上的先后顺序存储到Excel表格中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学;,未经大连海事大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410395461.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top