[发明专利]基于CPU+GPU异构系统的序列比对方法有效
申请号: | 201410522707.9 | 申请日: | 2014-09-29 |
公开(公告)号: | CN104504303B | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 朱香元 | 申请(专利权)人: | 肇庆学院 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 北京卓恒知识产权代理事务所(特殊普通合伙) 11394 | 代理人: | 唐曙晖;刘明芳 |
地址: | 526061 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了一种大规模生物序列比对及其基于异构系统的并行处理方法。首先,对序列优化存储,设计异构系统负载平衡方法;然后,设计异构系统内存优化方法,包括满足合并访问条件的序列存储方法、相似矩阵存储和访问方式、得分矩阵压缩存储,解决由于异构系统存储空间的匮乏而导致的实际计算性能低下;最后,基于内存预分配和复用策略,提出粗粒度序列比对并行方法。本发明基于CPU+GPU异构计算平台,充分利用了负载平衡和内存优化技术,从而显著提高大规模生物序列比对的处理效率。 | ||
搜索关键词: | 基于 cpu gpu 系统 序列 方法 | ||
【主权项】:
1.运行于CPU+GPU异构系统的序列比对方法或大规模序列比对方法,该方法包括以下过程:1)对序列进行优化存储,和实施异构系统负载平衡,其中在序列从CPU传输到GPU之前,先对序列进行序列优化存储;2)设计内存优化方式,该优化方式包括:满足合并访问条件的序列存储方式、相似矩阵存储和访问方式和得分矩阵压缩存储方式;其中内存优化方式包括:(1)满足合并访问的序列存储方式:当所有的序列被组织成包含16条序列组的序列集后,序列存储成字符矩阵的形式;这些序列集以交织的方式存储;每个交织的子集由序列组中的8个字符组成,即:首先存储序列集第一个序列组的8个字符,然后再存储该序列集第二个序列组的8个字符,由此类推;(2)相似矩阵存储和访问方式:相似矩阵的访问是随机的,并且它的大小完全依赖于所比对的序列;和/或(3)得分矩阵压缩存储方式:得分矩阵用来跟踪最优得分路径,记录比对过程中在每条序列插入空位的起始位置以及空位的数目;其中采用压缩方法MRLE来压缩得分矩阵,并且将原矩阵压缩成两个行向量Av和Ar;3)基于内存预分配和复用策略,采用粗粒度并行方式进行比对或并行比对;其中:采用粗粒度并行方式进行比对的过程包括:(1)运行一种内存预分配和复用策略,其中将一对序列集分配给一个线程进行比对;(2)常数时间工作任务获取过程,其中序列进行变换后,n条序列被组织成l个序列集{0,1,…,l‑1};和(3)粗粒度序列比对并行过程,其中一个线程处理一个序列集与另一个序列集之间的两两比对。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于肇庆学院,未经肇庆学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410522707.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用