[发明专利]一种基于DRAM存内计算的碱基序列过滤方法与装置有效
申请号: | 202211354686.5 | 申请日: | 2022-11-01 |
公开(公告)号: | CN115409174B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 杨弢;毛旷;汤昭荣;潘秋红;叶茂伟;黄智华;王京;王颖 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06N3/123 | 分类号: | G06N3/123;G16B30/00 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 311100 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dram 计算 碱基 序列 过滤 方法 装置 | ||
本发明公开一种基于DRAM存内计算的碱基序列过滤方法与装置,该方法为:步骤一,根据DRAM的存储阵列的列宽和所要筛选目标碱基序列的起点地址,筛选出目标碱基序列后进行重新整理组合;步骤二,对重新整理组合后的目标碱基序列分别进行碱基为A腺嘌呤、G鸟嘌呤、C胞嘧啶、T胸腺嘧啶的标记并获取到对应碱基的标记行;步骤三,对标记行数据进行移位后统计标记行中位置值为1的个数,获得对应碱基的统计结果;步骤四,利用参考碱基序列的统计结果与所述目标碱基序列的统计结果进行对比,过滤所筛选的目标碱基序列。本发明将位置匹配筛选放置在内存子阵列中进行,减少了大量数据在cpu与内存之间的搬移,成倍提升了计算效率,降低了功耗。
技术领域
本发明涉及计算机存内计算领域,具体涉及一种基于DRAM存内计算的碱基序列过滤方法与装置。
背景技术
基因是DNA(脱氧核糖核酸)分子上携带有遗传信息的功能片段,基因支持着生命的基本构造和性能。现有技术对于DNA样本已经有了一套成熟的处理流程,该流程通常由DNA测序、DNA序列定序、基因定位和变异检测三个步骤组成。DNA测序是指利用DNA测序仪将生物样本的DNA提取并转换成计算机能识别的数据序列Read,一般通过化学方法将DNA序列中的由A、C、T和G四种碱基链接而成的碱基序列识别出来,继而转换成由A、C、T、G(A-腺嘌呤G-鸟嘌呤 C-胞嘧啶 T-胸腺嘧啶)四个字符组成的计算机可识别的字符串序列,一个数据序列Read即为一个长度固定的DNA片段,是后续DNA序列处理的基本单位。例如,参考图1所示,一个数据序列Read的长度为10BP(BasePair,碱基对),则读出的数据s序列TCCTAATCTG即为一个Read。DNA测序的结果是生成一大堆的DNA Read,但是这些Read之间顺序未知。DNA序列的定序的作用就是将这些无序的DNA Read同公认的DNA参考序列进行比对计算,以得到各Read在参考序列中的最佳匹配位置。
由于脱氧核糖核酸的数据量非常巨大,通常在测序之前会对序列片段进行筛查和过滤,这种筛查过滤适合采用并行化计算的方式实现,存内计算为计算提供了一个良好的计算平台,可以减少大量数据的反复搬移,可以有效提高系统性能。
现代计算机系统中,数据在计算单元与内存中的搬移在系统功耗和程序运行时间上都占据了很大的比例。随着多核处理器的出现,越来越多的核被集成进同一芯片中,内存总带宽却并没有成比例的增长,造成了算力与数据传输间的不匹配,因而导致了所谓的“内存墙”问题。与此同时,计算资源虽然在增加,计算资源与动态随机存取存储器(以下简称“DRAM”)之间的通信延迟并没有改善,使得数据的搬移成为系统瓶颈之一。
为了解决这些挑战 业界陆续提出了多种新型计算方式,其中包括近内存计算、存内处理器、存内计算等。存内计算成为目前解决存储墙问题的关键技术之一。存内计算,顾名思义就是在存储器内进行运算,它可以显著降低数据交换带来的严重计算时延和功耗。目前出现了各种基于不同存储介质材料包括RRAM、PCM、STT-MRAM、DRAM等等的存内计算技术。目前通用的DRAM存储微架构如图2所示。
然而由于碱基序列数据量大,匹配的位置有非常多的可能,使用传统方法仍然存在计算量巨大的问题。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了一种基于DRAM存内计算的碱基序列过滤方法与装置,将位置匹配筛选放置在内存子阵列中进行,即在DRAM内进行计算,基于DRAM电容充放电可以完成基本逻辑操作的原理,通过统计某一段基因序列内即参考序列的AGCT碱基的数量,与目标序列的碱基数量进行对比,如果超过某一阈值,则认为这段序列与目标序列不匹配,从而达到筛查定位的目的,实现对碱基序列的定序计算,其具体技术方案如下:
一种基于DRAM存内计算的碱基序列过滤方法,包括以下步骤:
步骤一,根据DRAM的存储阵列的列宽和所要筛选目标碱基序列的起点地址,筛选出目标碱基序列后进行重新整理组合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211354686.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种板式散热器
- 下一篇:实现稳定供墨的喷墨打印供墨系统及其供墨回收方法