[发明专利]氨基酸序列特征提取方法、装置、存储介质及电子设备有效
申请号: | 201711377471.4 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108229102B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 汤一凡;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 南毅宁;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种氨基酸序列特征提取方法、装置、存储介质及电子设备。该方法包括:获取待进行特征提取的氨基酸序列;确定所述氨基酸序列的位置特异性得分矩阵PSSM;确定每种预设氨基酸在[‑S,S]分数区间内的得分分布;合并M种预设氨基酸的所述得分分布,以获得所述氨基酸序列的特征向量。由于确定出的氨基酸序列的位置特异性得分矩阵PSSM中蕴含有同源蛋白质信息,因此该位置特异性得分矩阵PSSM表示成的特征向量中能够融入更多的序列保守信息,更有利于氨基酸序列与其他生物高分子物质之间的相互作用的预测,且预测效率高。并且,能够将位置特异性得分矩阵PSSM转换成固定长度的特征向量,为氨基酸序列特征提供了一种多维空间表达方式。 | ||
搜索关键词: | 氨基酸 序列 特征 提取 方法 装置 存储 介质 电子设备 | ||
【主权项】:
1.一种氨基酸序列特征提取方法,其特征在于,所述方法包括:获取待进行特征提取的氨基酸序列;确定所述氨基酸序列的位置特异性得分矩阵PSSM,其中,所述位置特异性得分矩阵PSSM的大小为N×M,N表示所述氨基酸序列的序列长度,M表示预设氨基酸的总数,所述位置特异性得分矩阵PSSM中的每个分数PSSM(n,m)表示在第n行的氨基酸的位置下,第m列的预设氨基酸出现的倾向程度,且‑S≤PSSM(n,m)≤S,其中,N、M和S均为正整数,且1≤n≤N,1≤m≤M;确定每种预设氨基酸在[‑S,S]分数区间内的得分分布;合并M种预设氨基酸的所述得分分布,以获得所述氨基酸序列的特征向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711377471.4/,转载请声明来源钻瓜专利网。