[发明专利]基于层次注意力神经网络的结核分枝杆菌耐药性预测方法及装置有效
申请号: | 202210206029.X | 申请日: | 2022-03-03 |
公开(公告)号: | CN114582429B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 孙群;蒋中华;于中华;陈黎;卢永美;刘卓翀 | 申请(专利权)人: | 四川大学;四川生美思达生物科技有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B40/20;G06F40/20;G06F40/30;G06N3/0442;G06N3/0455;G06N3/0464;G06N3/048;G06N3/0499;G06N3/047 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 王朋飞 |
地址: | 610044 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 注意力 神经网络 结核 分枝杆菌 耐药性 预测 方法 装置 | ||
本发明公开了一种基于层次注意力神经网络的结核分枝杆菌耐药性预测方法及装置,涉及生物信息学、深度学习与计算机应用技术领域。本发明利用自然语言处理(NLP)技术解决耐药性预测的问题,将菌株基因上的突变视为词、相应基因中所有突变视为句子、将一个菌株(或样本)视为由这种句子组成的文档。通过使用全基因组突变及其位置信息作为输入,从而预测耐药性以及识别耐药性相关基因和突变。本发明对结核分枝杆菌耐药性预测方法克服了以往大多数研究无法有效处理全基因组数据进行耐药性预测的缺陷,显示了发现新型耐药性相关基因和突变的可能性。本发明方法可以作为一种通用方法,以高效率和高精确度探索基于全基因组突变的其他细菌耐药预测的问题。
技术领域
本发明涉及生物信息学、深度学习与计算机应用技术领域,更具体地说涉及一种基于层次注意力神经网络的结核分枝杆菌耐药性预测方法及装置。
背景技术
致病微生物的耐药性对全球公共卫生构成了严重的挑战,而结核病(TB)是当今世界最致命的传染病杀手和主要死亡原因之一。
耐药性结核病是一个严重公共卫生威胁。对耐药结核病的快速诊断和正确治疗对预防和控制结核并具有积极意义。另一方面,由于对一些抗结核药物的耐药机制研究较少,发现潜在的耐药基因和突变将有助于了解抗生素的耐药机制,促进药物的改进和发展。
由于结核分枝杆菌的耐药突变基因仅在染色体上存在,其耐药基因不会从一个细胞跑到另一个细胞中,基因结核分枝杆菌耐药突变基因的上述特性,可以通过对结核分枝杆菌的耐药性基因进行分析,从而确定该结核分枝杆菌对某种抗结核药物的耐药性预测。
抑制结核分枝杆菌的抗结核药物有很多种,且该抑制结核分枝杆菌的抗结核药物多多少少会对病患身体造成一定的损伤,医生在对肺结核患者进行用药之前,并不清楚该患者对哪种抗结核药物具有耐药性,而对于结核分枝杆菌的耐药性结核分枝杆菌(MTB)的表型药敏试验(DST)往往需要几周时间,若等待药敏试验结果再进行用药,则会大大耽误病患的病情。现有医院针对肺结核病患的用药方式尽量采用耐药性少的抗结核药物,若该抗结核药物无法起到抑制效果,再更换其他抗结核药物,这种方式给病患身体带来较大的负担。
国家知识产权局于2021年8月31日,公开了一件公开号为CN113330123A,名称为“结核病耐药性预测方法”的发明专利公开文本,公开了一种预测分枝杆菌耐药性的方法,包括从样品中分离分枝杆菌核酸,从该核酸获得样品序列,将该样品序列与参考序列进行比对和比较,并对每个参考位置确定该样品序列值是否与表中分配至该位置的特定序列值相同。如果两个值相同,则将位置权重值分配给该位置。通过将所有位置权重值相加获得预测值,并将预测值与阈值进行比较。如果预测值小于阈值,则预测为耐药。
上述现有技术中的结核病耐药性预测方法的预测原理是:判定样品的序列中是否含有已知耐药基因位点进行耐药预测,对于耐药位点不明确的药物,预测效果不佳。这种方法也被称为直接关联法,其无法对耐药机制不明的药物做出耐药预测。且现有技术中,大多数研究只使用预选基因的突变基因作为预测输入,使用独热编码对突变进行编码,且之用“1”和“0”来表示突变的存在或不存在,数据过于稀疏,徒增计算量,同时也忽略了突变和相应基因之间的关系。
发明内容
为了克服上述现有技术中存在的缺陷和不足,本发明提供了一种基于层次注意力神经网络的结核分枝杆菌耐药性预测方法及装置。本发明的发明目的在于提供一种结核分枝杆菌耐药性预测的改进方法,以解决现有技术中结核分枝杆菌耐药性预测方法预测精度低、处理全基因组数据效率低,且无法发现新的耐药基因的问题。本发明首创将突变信息与突变相对于基因的位置信息、以及突变基因相对于菌株全基因组的位置信息相结合作为预测输入,利用NLP技术解决耐药性预测的问题,将菌株基因上的突变视为词、相应基因中所有突变视为句子、将一个菌株(或样本)视为由这种句子组成的文档。以层次注意力神经网络作为基础,将全基因组突变及其位置信息作为输入来预测耐药性和识别耐药性相关基因和突变,解决了以往研究无法有效处理全基因组数据的缺陷,显示了发现新型耐药性相关基因和突变的可能性,且本发明预测效率高,预测结果准确度高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学;四川生美思达生物科技有限公司,未经四川大学;四川生美思达生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210206029.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种太阳能柔性电池
- 下一篇:一种稻麦生产田间免维护肥水自控温装置