[发明专利]蛋白质检索模型构建方法、检索方法、设备和存储介质在审
申请号: | 201910785465.5 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110556159A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 彭玉旭;彭贤;张广平;罗元盛;黄园媛 | 申请(专利权)人: | 长沙理工大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B50/30 |
代理公司: | 44205 广州嘉权专利商标事务所有限公司 | 代理人: | 赵琴娜 |
地址: | 410114 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 形状描述符 三角网格 蛋白质 不敏感性 存储介质 检索模型 检索算法 检索效率 简化处理 溶剂排除 数据集中 种蛋白质 转换过程 变形的 不变性 去噪声 冗余 构建 算法 融合 申请 | ||
1.一种蛋白质检索模型构建方法,其特征在于,包括:
对数据集中的所有蛋白质分别生成溶剂排除表面的三角网格,并进行简化和缺陷修复;
用WKS算法计算经前一步骤处理后所有三角网格每个顶点的WKS特征,选取适量的WKS特征,用K均值算法进行聚类,生成第一词典,根据每个蛋白质的三角网格的每个顶点的WKS特征和所述第一词典,计算相应蛋白质的第一BoF特征;用HKS算法计算经前一步骤处理后所有三角网格每个顶点的HKS特征,选取适量的HKS特征,用K均值算法进行聚类,生成第二词典,根据每个蛋白质的三角网格的每个顶点的HKS特征和所述第二词典,计算相应蛋白质的第二BoF特征;
将每一个蛋白质的所述第一BoF特征和第二BoF特征进行归一化处理并拼接,得到每一个蛋白质的第三BoF特征;
根据不同蛋白质的第三BoF特征的差异程度进行相似度评估;
模型训练,确定所述三角网格模型面大小及所述第一词典和第二词典大小。
2.根据权利要求1所述的蛋白质检索模型构建方法,其特征在于,所述三角网格模型面大小为4000,所述第一词典和第二词典大小均为1000。
3.根据权利要求1所述的蛋白质检索模型构建方法,其特征在于,所述根据不同蛋白质的第三BoF特征的差异程度进行相似度评估,包括:根据归一化后不同蛋白质的所述第三BoF特征的L1-范数距离大小评估其形状相似程度。
4.根据权利要求1所述的蛋白质检索模型构建方法,其特征在于,所述模型训练,确定所述三角网格模型面大小及所述第一词典和第二词典大小,包括:
固定所述第一词典和第二词典大小,改变三角网格模型面大小进行训练,根据训练结果确定所述三角网格模型面大小;
依据确定的所述三角网格模型面大小,改变所述第一词典和第二词典大小进行训练,根据训练结果确定所述第一词典和第二词典大小。
5.一种蛋白质检索方法,其特征在于,包括:
将待检索蛋白质输入权利要求1-4任意一项所述的方法所构建的蛋白质检索模型中,生成溶剂排除表面的三角网格,并进行简化和缺陷修复;
用WKS算法计算经前一步骤处理后的所述三角网格每个顶点的WKS特征,结合所述蛋白质检索模型的第一词典,计算待检索蛋白质的第一BoF特征;用HKS算法计算经前一步骤处理后的所述三角网格每个顶点的HKS特征,结合所述蛋白质检索模型的第二词典,计算待检索蛋白质的第二BoF特征;
将所述第一BoF特征和第二BoF特征进行归一化处理并拼接,得到待检索蛋白质的第三BoF特征;
根据所述第三BoF特征与所述蛋白质检索模型中已有蛋白质的第三BoF特征的差异程度进行相似度评估,输出与所述待检索蛋白质相似的已知蛋白质的信息。
6.根据权利要求5所述的蛋白质检索方法,其特征在于,相似性评估的方法,包括:根据归一化后待检索蛋白质的所述第三BoF特征与所述蛋白质检索模型中已有蛋白质的第三BoF特征的L1-范数距离大小评估其形状相似程度。
7.一种蛋白质检索模型构建设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的至少一个存储器;
所述至少一个存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-4任意一项所述的蛋白质检索模型构建方法。
8.一种蛋白质检索设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的至少一个存储器;
所述至少一个存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求5或6所述的蛋白质检索方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序被处理执行时,实现权利要求1-4任一项所述的蛋白质检索模型构建方法,或,权利要求5或6所述的蛋白质检索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910785465.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:抗心肌纤维化药物的筛选方法
- 下一篇:一种生物样本分析检测系统