[发明专利]用于加速史密斯-沃特曼序列对齐的技术在审
申请号: | 202210792147.3 | 申请日: | 2022-07-05 |
公开(公告)号: | CN115905786A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | M·P·特尔里克;A·S·蒂鲁马拉;S·加德雷 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F17/18;G06F9/50;G06F9/38 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 加速 史密斯 沃特曼 序列 对齐 技术 | ||
提供了用于加速史密斯‑沃特曼序列对齐的各种技术。例如,一组线程中的线程用于使用交错单元格布局将相关数据存储在寄存器中,同时为一个或更多个局部对齐问题计算子对齐数据。在另一个示例中,使用减少计算每个子对齐分数所需的周期数的专用指令。在另一个示例中,线程用于计算一个或更多个局部对齐问题的列的子集的子对齐数据,而其他线程基于从先前线程接收的部分结果数据开始计算子对齐数据。在计算出最大子对齐分数后,线程将最大子对齐分数和对应的位置存储在全局存储器中。
技术领域
各种实施例一般涉及并行处理系统,更具体地,涉及用于加速史密斯-沃特曼(Smith-Waterman)序列对齐的技术。
背景技术
Smith-Waterman算法用于各种应用,例如科学、工程和数据应用,用于量化两个序列的子序列对齐的好坏,并确定优化的子序列的对齐或这些序列的“局部对齐”。例如,Smith-Waterman算法是许多基因组学算法的构建块,例如用于确定生物体DNA序列以及将DNA或蛋白质序列与基因组数据库进行比较的算法。
为了使用Smith-Waterman算法解决目标序列“T”和查询序列“Q”的局部对齐问题,软件应用程序实施了矩阵填充阶段和回溯阶段或反向矩阵填充阶段。在矩阵填充阶段,软件应用程序实施动态编程技术,将优化局部对齐的计算分解为二维(2D)评分矩阵“H”中包括的相互依赖的子对齐分数的计算。评分矩阵包括但不限于初始值的最顶行和最左列、目标序列的每个符号的不同行以及查询序列的每个符号的不同列。对于长度为M的目标序列和长度为N的查询序列Q,评分矩阵因此是(M+1)x(N+1)矩阵。由于初始值的行和列引入的偏移量,对于0j=M和0k=N,表示为H(j,k)的子对齐分数量化了以符号T(j-1)结尾的T的任意子序列和以符号Q(k-1)结尾的Q的任意子序列之间的最大相似度。作为矩阵填充阶段的一部分,软件应用程序确定最大子对齐分数和最大子对齐分数在评分矩阵内的位置。在回溯阶段或反向矩阵填充阶段,软件应用程序确定评分矩阵内对应于最大子对齐分数的起始位置。起始位置和最大子对齐分数的位置定义了与目标序列和查询序列的优化局部对齐对应的目标子序列和查询子序列。
因为对长度为M的T和长度为N的Q执行矩阵填充阶段需要(MxN)时间或“二次时间”,而执行回溯阶段需要(M+N)或“线性时间”,在解决许多局部对齐问题时,矩阵填充阶段可能是性能瓶颈。在这方面,对于0j=M和0k=N,可以通过以下等式(1a)–(1c)计算H(j,k):
在等式(1a)-(1c)中,E和F是存储中间结果的矩阵,以便在计算相关子对齐分数时重复使用。GapDeleteExtend、GapDeleteExtend、GapInsertOpen和GapInsertExtend是“间隙(gap)”常数;Substitution(T(j-1),Q(k-1))是对于符号T(j-1)和Q(k-1)包括在对应于符号匹配值(例如,4)或符号失配值(例如,-1)的替换矩阵中的替换值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210792147.3/2.html,转载请声明来源钻瓜专利网。