[发明专利]存有数据信息的DNA序列的处理方法及装置有效
申请号: | 202011137220.0 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112288090B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 黄小罗;戴俊彪 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06N3/12 | 分类号: | G06N3/12;G16B50/50;G16B50/40 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 黄志云 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存有 数据 信息 dna 序列 处理 方法 装置 | ||
本申请涉及生物信息技术领域,尤其涉及一种存有数据信息的DNA序列的处理方法及装置。所述方法包括:获取待压缩的DNA序列,DNA序列是根据待存储的数据信息转换所得,DNA序列包括M个碱基重复片段;根据预设的重复次数与基准碱基组之间的对应关系,对DNA序列进行编码,得到压缩序列,压缩序列包括M个编码片段,M个碱基重复片段与M个编码片段一一对应;对压缩序列进行拆分,得到解码序列和信息序列,解码序列包括M个编码片段中的基准碱基组,信息序列包括压缩序列除基准碱基组以外的其他碱基单元和标记物。本申请提供的方法,能够提升DNA数据存储信息的信息编码密度及数据安全性。
技术领域
本申请涉及生物信息技术领域,特别是属于DNA信息存储技术领域,更具体地涉及一种存有数据信息的DNA序列的处理方法及装置。
背景技术
随着互联网及人工智能大数据的发展,人类社会每天产生的数据里量呈爆炸式的增长。互联网数据中心(Internet Data Center,IDC)预测,截止到2020年,世界范围内的数据总量将达到44ZB(44×1012GB)。传统的存储介质比如磁带、光盘、硬盘等耗电量高,存储周期短,成本高;同时,用于信息存储的硅资源储量急剧枯竭,因此,寻找硅基存储的替代物,实现低成本、高效稳定且长期的数据存储对于目前信息社会的高速发展尤为重要。
脱氧核糖核酸(DeoxyriboNucleic Acid,DNA)是由脱氧核苷酸组成的大分子聚合物,其中,脱氧核苷酸由碱基、脱氧核糖和磷酸构成。构成脱氧核苷酸的碱基包括4种,分别为腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)。基于DNA的数据存储技术是利用上述四种碱基序列来表示二进制“0”和“1”组成的数据系列。相比较于传统存储介质,DNA数据存储具有存储密度高,存储时间久,维护成本低,生物相容性好的特点。据理论推算,1gDNA能够实现455EB的数据存储,比传统介质提高6-7个数量级。DNA同时能够稳定存储数据千年以上,同时在维护资源,比如占地、电力等方面要求非常低。由于DNA本身是自然界的遗传物质,DNA存储数据还能放入动植物微生物细胞中,实现代代相传的永久数据存储。
DNA数据存储流程通常包含以下步骤:(1)根据二进制与碱基A、T、C、G之间的预设对应关系,将二进制数据信息转换为由碱基A、T、C、G编码形成的、存储有数据信息的DNA序列;(2)采用高通量DNA合成仪,结合酶拼接技术,合成上述存储有数据信息的DNA序列;(3)采用一代或者二代高通量测序仪对合成DNA序列进行测序;4)根据预设对应关系,将A/T/C/G形成的DNA序列转换为二进制数据信息。该方法中,步骤(1)中,将二进制信息转换为DNA序列的过程中,由于二级制中存储的信息由转换后的DNA序列承载,因此,转换后的DNA序列中碱基数量的多少直接关系到步骤(2)中DNA序列的合成数量以及整个DNA数据存储的存储密度。在二进制数据信息大小既定的情况下,DNA序列的碱基数量越多,单个碱基平均承载的数据信息越小,DNA数据存储的存储密度越小;相反,DNA序列的碱基数量越少,单个碱基平均承载的数据信息越多,DNA数据存储的存储密度越大。目前,已经报道的方法,将二进制0/1信息转换到A/T/C/G的DNA序列信息后,能够实现2bits/nt(bits/nt表示:位/个碱基或比特/个碱基)的数据存储密度,但对于更高的数据存储密度,尚未有报道。
发明内容
本申请的目的在于提供一种存有数据信息的DNA序列的处理方法及装置,旨在解决现有的DNA数据存储技术的数据存储密度较小的问题。
为实现上述申请目的,本申请采用的技术方案如下:
第一方面,提供了一种存储有数据信息的DNA序列的处理方法,方法包括:
获取待压缩的DNA序列,DNA序列是根据待存储的数据信息转换所得,DNA序列包括M个碱基重复片段,每个碱基重复片段包括连续且重复的碱基单元,M≥1,M为整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011137220.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力施工用紧急救援设备
- 下一篇:一种可回收复合盖膜的制备方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置