[发明专利]一种新的分析生物基因组拷贝数变异的可视化方法在审
申请号: | 201710266656.1 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107133494A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 宋凯;毕家豪 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18;G06F19/26 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 宋洁瑾 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种新的分析生物基因组拷贝数变异的可视化方法,把每个染色体的所有基因,按照每个基因的ucstart位置作为横坐标,该基因对应的所有样本拷贝数的均值或者中位数作为纵轴,然后用MATLAB绘制散点,一种颜色表示一种癌症。如果要对比多种癌症类型,我们根据颜色就可以很清楚的知道是哪种癌症类型,它们之间的比较可视化效果最佳。如果要对比同一种癌症类型下的肿瘤样本和正常样本,肿瘤样本表示成一种颜色,正常样本表示成另外一种颜色,它们之间的比较可视化效果也是最佳的。相比之前的可视化方法,我们用的这种可视化方法,可以很清晰明了的对比不同的癌症类型的拷贝数变异或者在同一个癌症类型下不同类型样本的拷贝数变异对比。 | ||
搜索关键词: | 一种 分析 生物 基因组 拷贝 变异 可视化 方法 | ||
【主权项】:
一种新的分析生物基因组拷贝数变异的可视化方法,其特征在于,包括以下步骤:(1)横纵坐标的确定:人体有22条常染色体,基因约含3万多个基因,每个基因都有具体对应的几号染色体和对应的具体的起始位置,把每个染色体的所有基因,按照每个基因的起始位置作为横坐标,用matlab软件中的均值函数或者中位数函数遍历该基因对应的所有样本拷贝数,将该基因的均值或者中位数值作为纵坐标;(2)绘图:用matlab中的plot函数,绘制点;由于每条染色体上的基因个数很多,所有绘制出的结果是点很密;(3)生物中每条染色体的着丝粒都有具体的位置坐标,用matlab中的line函数,用黑色的竖杠将着丝粒表示出来,同时将染色体p臂,q臂上的基因分隔开来。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710266656.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用