[发明专利]氨基酸序列特征提取方法、装置、存储介质及电子设备有效
申请号: | 201711377471.4 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108229102B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 汤一凡;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 南毅宁;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 氨基酸 序列 特征 提取 方法 装置 存储 介质 电子设备 | ||
1.一种氨基酸序列特征提取方法,其特征在于,所述方法包括:
获取待进行特征提取的氨基酸序列;
确定所述氨基酸序列的位置特异性得分矩阵PSSM,其中,所述位置特异性得分矩阵PSSM的大小为N×M,N表示所述氨基酸序列的序列长度,M表示预设氨基酸的总数,所述位置特异性得分矩阵PSSM中的每个分数PSSM(n,m)表示在第n行的氨基酸的位置下,第m列的预设氨基酸出现的倾向程度,且-S≤PSSM(n,m)≤S,其中,N、M和S均为正整数,且1≤n≤N,1≤m≤M;
确定每种预设氨基酸在[-S,S]分数区间内的得分分布,其中,所述得分分布为1×(2S+1)的特征向量;
合并M种预设氨基酸的所述得分分布,以获得所述氨基酸序列的特征向量。
2.根据权利要求1所述的方法,其特征在于,所述确定每种预设氨基酸在[-S,S]分数区间内的得分分布,包括:
针对每种预设氨基酸,根据该预设氨基酸的全部分数,统计在[-S,S]分数区间内的每个整数分数的出现频率,并按照所述整数分数由小及大的顺序,将所述整数分数的出现频率组合成1×(2S+1)的特征向量,所得特征向量作为该预设氨基酸在[-S,S]分数区间内的得分分布。
3.根据权利要求1所述的方法,其特征在于,所述确定每种预设氨基酸在[-S,S]分数区间内的得分分布,包括:
设每种预设氨基酸在[-S,S]分数区间内的得分分布为f(m),其中,f(m)为1×(2S+1)的特征向量,通过以下公式计算f(m)中的每个元素值fj(m),其 中,j=0,…,2S:
。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述M种预设氨基酸为20种天然氨基酸。
5.一种氨基酸序列特征提取装置,其特征在于,所述装置包括:
获取模块,用于获取待进行特征提取的氨基酸序列;
第一确定模块,用于确定所述获取模块获取到的所述氨基酸序列的位置特异性得分矩阵PSSM,其中,所述位置特异性得分矩阵PSSM的大小为N×M,N表示所述氨基酸序列的序列长度,M表示预设氨基酸的总数,所述位置特异性得分矩阵PSSM中的每个分数PSSM(n,m)表示在第n行的氨基酸的位置下,第m列的预设氨基酸出现的倾向程度,且-S≤PSSM(n,m)≤S,其中,N、M和S均为正整数,且1≤n≤N,1≤m≤M;
第二确定模块,用于确定每种预设氨基酸在[-S,S]分数区间内的得分分布,其中,所述得分分布为1×(2S+1)的特征向量;
合并模块,用于合并M种预设氨基酸的所述得分分布,以获得所述氨基酸序列的特征向量。
6.根据权利要求5所述的装置,其特征在于,所述第二确定模块用于:
针对每种预设氨基酸,根据该预设氨基酸的全部分数,统计在[-S,S]分数区间内的每个整数分数的出现频率,并按照所述整数分数由小及大的顺序,将所述整数分数的出现频率组合成1×(2S+1)的特征向量,所得特征向量作为该预设氨基酸在[-S,S]分数区间内的得分分布。
7.根据权利要求5所述的装置,其特征在于,所述第二确定模块用于:
设每种预设氨基酸在[-S,S]分数区间内的得分分布为f(m),其中,f(m)为1×(2S+1)的特征向量,通过以下公式计算f(m)中的每个元素值fj(m),其中,j=0,…,2S:
。
8.根据权利要求5-7中任一项所述的装置,其特征在于,所述M种预设氨基酸为20种天然氨基酸。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
权利要求9中所述的计算机可读存储介质;以及
一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711377471.4/1.html,转载请声明来源钻瓜专利网。