[发明专利]蛋白质分类方法在审

专利信息
申请号: 201911376845.X 申请日: 2019-12-27
公开(公告)号: CN111210870A 公开(公告)日: 2020-05-29
发明(设计)人: 魏志强;聂婕;聂为之;刘安安;苏育挺 申请(专利权)人: 青岛海洋科学与技术国家实验室发展中心
主分类号: G16B20/00 分类号: G16B20/00;G16B40/00;G16B15/00;G06K9/62;G06N3/04
代理公司: 青岛联智专利商标事务所有限公司 37101 代理人: 王笑
地址: 266000 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 蛋白质 分类 方法
【说明书】:

发明公开了一种蛋白质分类方法,包括如下步骤:将蛋白质三维模型置入N*N*N大小的体素占据网格;对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;基于射线与蛋白质三维模型的相交情况构建占据模型;将所述占据模型通过三维卷积神经网络实现对蛋白质的分类;采用体素占据网格实现对蛋白质结构的体积表示,从原始蛋白质体积数据中利用机器学习为蛋白质创建快速准确的分类器,对蛋白质数据集实现了高速高精度的分类效果。

技术领域

本发明属于蛋白质数据分类技术领域,具体地说,是涉及一种蛋白质分类方法。

背景技术

结构生物学的目标,包括全面理解分子的形状和由生物大分子支撑的形式,并扩展这方面的内容,以理解如何使用不同的分子结构来呈现大多数生物过程。在这些大分子中,蛋白质是参与大多数过程的关键效应器,具有动态复杂的表面;它们可以由成千上万个原子组成,在原子尺度上由于局部(残基侧链)或全局(环或域)结构变化而表现出多种不同的构象,这些结构变化极大地影响它们的全局和局部形状。

由于蛋白质的结构与它们的功能有关,而它们之间相互作用的中断可能导致疾病状态,因此对它们的形状进行表征非常重要,有助于识别潜在的粘合剂,如其他蛋白质、药物或核酸等。

蛋白质分类是生物信息学中的关键问题之一,许多无监督方法被应用于蛋白质分类问题中,其中的代表性方法包括自然矢量方法、蛋白质地图、K-string字典、Yau-Hausdorff距离等。随着机器学习的快速发展,将机器学习方法应用于蛋白质分类也取得了很大进展。Khan等采用蚁群优化方法,结合关联规则挖掘与监督分类机制对蛋白质进行分类;Lacey等将隐马尔可夫模型与随机决策树应用于蛋白质分类;Islam等将自然语言处理的N-Gra模型应用于蛋白质分类等考虑到蛋白质的三维结构包含大量信息,Jiang等提出将图核应用于蛋白质的图结构信息提取,并结合SVM进行分类;对于蛋白质各种特征信息的融合问题,Singh等采用混合特征选择技术对蛋白质进行分类。

然而,上述的现有技术在很大程度上已经被基于深度学习的方法所取代,在这种方法中,特征和分类器是共同从数据中学习的;特别是卷积神经网络(CNNs),极大地提高了图像目标识别的技术水平。但基于CNNs的蛋白质数据分类方法目前面临的挑战主要有两个方面:1)虽然将CNNs基本方法扩展到体积数据在概念上很简单,但是不清楚哪些体系结构和数据表示会产生良好的性能;

2)体积难以计算。

发明内容

本发明的目的在于提供一种蛋白质分类方法,采用体素占据网格实现对蛋白质结构的体积表示,从原始蛋白质体积数据中利用机器学习为蛋白质创建快速准确的分类器,对蛋白质数据集实现了高速高精度的分类效果。

具体的,本发明采用以下技术方案予以实现:

提出一种蛋白质分类方法,包括如下步骤:将蛋白质三维模型置入N*N*N大小的体素占据网格;对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;基于射线与蛋白质三维模型的相交情况构建占据模型;将所述占据模型通过三维卷积神经网络实现对蛋白质的分类。

进一步的,基于射线与蛋白质三维模型的相交情况构建占据模型,具体包括:确定穿过体素中心的射线命中蛋白质三维模型的情况;基于命中情况构建占据模型。

进一步的,在确定穿过体素中心的射线命中蛋白质三维模型的情况中,包括对命中概率估算的步骤:使用将射线所经过的每个体素进行更新;其中,locc和lfree分别表示在命中和未命中体素的情况下,体素被占用或空闲的对数概率;为测量序列,zt=1表示命中体素,zt=0表示未命中体素。

进一步的,构建占据模型,具体包括:将蛋白质三维模型光栅化为体素网格;将命中的体素认定为蛋白质三维模型的内部,将未命中的体素认定为蛋白质三维模型的外部。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海洋科学与技术国家实验室发展中心,未经青岛海洋科学与技术国家实验室发展中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911376845.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top