[发明专利]一种可解释性的膜蛋白跨膜螺旋预测方法无效

专利信息
申请号: 201210261613.1 申请日: 2012-07-27
公开(公告)号: CN102831332A 公开(公告)日: 2012-12-19
发明(设计)人: 於东军;沈红斌;唐振民;杨静宇 申请(专利权)人: 南京理工大学常熟研究院有限公司;南京理工大学
主分类号: G06F19/18 分类号: G06F19/18
代理公司: 暂无信息 代理人: 暂无信息
地址: 215513 江苏省苏州市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种可解释性的膜蛋白跨膜螺旋预测方法。首先利用PSI-BLAST程序获取蛋白质的进化信息,并使用滑动窗口技术抽取每个氨基酸残基的特征;然后,利用自组织神经网络(SOM)学习跨膜螺旋在特征空间中的分布规律,将分布规律知识编码在SOM的权值向量中;最后,使用Wang-Mendel方法提取可解释性的模糊规则集;对于给定的待预测蛋白质的每个氨基酸残基使用模糊推理技术进行预测,得到预测曲线后,使用动态阈值分割技术确定每个氨基酸残基是否属于跨膜螺旋片段。优点在于:一是使用SOM学习,挖掘跨膜螺旋分布规律知识并降低原始数据的噪声;二是使用模糊规则提取技术获取的跨膜螺旋预测模型具有很高的可解释性。
搜索关键词: 一种 解释性 膜蛋白 螺旋 预测 方法
【主权项】:
1.一种可解释性的膜蛋白跨膜螺旋预测方法,其特征在于包括以下步骤:第一步:特征提取,将蛋白质序列中的氨基酸残基转换为向量形式表示;对于一个由个氨基酸组成的蛋白质,通过 PSI-BLAST算法得到其特定位置得分矩阵(Position Specific Scoring Matrix, PSSM), 该矩阵为行20列,先对该PSSM进行逐行标准化,然后使用滑动窗口技术得到每个氨基酸残基的特征矩阵,特征矩阵按列求均值,得到该残基的20维特征向量:,其中表示第几个残基;第二步:模式特征分布规律学习,使用自组织映射神经网络(Self-organizing Map, SOM),在特征空间中学习样本的分布规律,并消除原始训练样本噪声,对于给定的训练样本集,其中0表示非跨膜,1表示跨膜,使用批量学习算法来训练SOM,直到SOM收敛或是达到预先设定的学习步数;第三步:模糊规则提取,从训练好的SOM的权值向量(codebook vectors)提取模糊规则,使用Wang-Mendel规则提取算法从SOM的权值向量集中提取模糊规则集;第四步:蛋白质跨膜螺旋预测,对于给定的待预测蛋白质,使用上述步骤三中所提取的模糊规则集,应用模糊推理方法,对其中的氨基酸残基的跨膜螺旋性进行逐个预测,得到预测曲线,然后使用阈值分割的方法,确定每个残基是否属于跨膜螺旋片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学常熟研究院有限公司;南京理工大学,未经南京理工大学常熟研究院有限公司;南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210261613.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top