[发明专利]基于纳米孔电信号的病原体快速分类方法及系统在审

专利信息
申请号: 202210472296.1 申请日: 2022-04-29
公开(公告)号: CN114707559A 公开(公告)日: 2022-07-05
发明(设计)人: 林立安;何子亭 申请(专利权)人: 广州孔确基因科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04;G06N3/08;G16B30/00;G16B40/00;G16B40/10;G16B40/20
代理公司: 重庆恩洲知识产权代理事务所(特殊普通合伙) 50263 代理人: 兰渝宏;熊传亚
地址: 510320 广东省广州市黄埔*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 纳米 电信号 病原体 快速 分类 方法 系统
【说明书】:

本发明公开了一种基于纳米孔电信号的病原体快速分类方法,其包括步骤:S1,构建样本库,其包括训练样本和各已知病原体的种类标签,训练样本包括各已知病原体的测序片段进行纳米孔测序得到的原始电信号;S2,构建端到端的卷积神经网络模型,用于构建电信号到病原体种类标签的映射关系;S3,利用训练样本对卷积神经网络模型进行训练,以建立电信号到病原体种类标签的映射关系,得到病原体分类器;S4,利用病原体分类器对待测电信号进行快速分类,得到病原体分类概率矩阵,并将病原体分类概率矩阵中概率最高对应的病原体种类标签作为待测电信号对应的病原体种类。相较于现有技术,无需预先构建对比库,也无需将电信号进行转换,大大提高了分类速度。

技术领域

本发明属于纳米孔测序信号处理技术领域,其涉及一种基于纳米孔测序信号进行病原体快速识别方法及系统。

背景技术

核酸序列信息的确定是生物学研究和医学研究的重要部分。序列信息有助于鉴定基因与疾病和表型的关联性、鉴定潜在的药物靶标、以及了解疾病发展和进展的机制。序列信息是个体化医疗的重要部分,其中它可以用于优化在特定受试者中对疾病的诊断、治疗、或预防。

核酸测序是一个可用于提供核酸样品的序列信息的过程。这样的序列信息在对受试者进行诊断和/或治疗中可能是有帮助的。例如,受试者的核酸序列可用于鉴定、诊断遗传疾病,并且可能开发针对该遗传疾病的治疗。作为另一个例子,对病原体的研究可导致针对接触性传染病的治疗。

纳米孔测序是目前新兴的第三代基因测序技术,其通过对纳米孔施加电位,当核酸等分析物在纳米孔中通过时,电流会发生改变,然后将捕获的电流信号通过神经网络模型解码成碱基序列,再将碱基序列与一个参考基因组进行比对,得到所属的分类标签。而目前所有的测序技术基因组分析都是将测序得到的电信号转化为A、T、C、G后再进行序列对比,从而确定生物体或者进行特异性分析。例如,中国发明专利申CN202011205178.1公开了一种基于深度网络快速识别单分子纳米孔测序碱基方法,其将电信号序列转换为碱基序列。

理想情况下,一个碱基对应了电信号波形中的一个台阶信号,并且每个碱基ATGC都有自己特有的电流振幅,因此,当可将检测到的电信号转换为碱基,进行对比后识别。然而,由于纳米孔具有大小,实际情况是相邻几个碱基贡献了一个台阶,因此,实际上是将电信号值分类到不同的碱基组合中,也即每次测序仪所捕获的并非单一碱基的信号值,而是一串儿碱基的共同的信号值,序列中一共有四种碱基,DNA为(ATCG),RNA为(AUGC)。一次信号通常是5个碱基,碱基识别的原理就是将测序得到的Squiggle信息与已知信息进行比对,从而判断出碱基组合。然而在实际测序过程中,每次捕获的不一定都是5个碱基,也可能4-6个碱基。根据排列组合,一共可能包括44,或45或46,合计5376个组合形式;并且一些碱基还可能发生甲基化,这就增加了basecalling的难度,并且在转化过程中会放大误差,从而降低精确度,并且由于需要先将电信号转换为碱基序列,再进行对比,整个过程速度较慢。

发明内容

本发明的目的在于提供一种基于纳米孔电信号快速识别病原体的方法及系统,部分地解决或缓解现有技术中的上述不足,能够一定程度地提高病原体分类的速度。

为一定程度地提高病原体的分类速度,本发明提供了一种基于纳米孔电信号的病原体快速分类方法,其包括步骤:

S1,构建样本库,所述样本库包括训练样本和各已知病原体的种类标签,所述训练样本包括所述已知病原体的测序片段进行纳米孔测序得到的原始电信号;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州孔确基因科技有限公司,未经广州孔确基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210472296.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top