[发明专利]蛋白质亚细胞定位方法、系统、储存介质及计算机设备有效
申请号: | 202011316678.2 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112259160B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 钟光正;肖燕珊;刘波 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G06F18/214;G06N20/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 细胞 定位 方法 系统 储存 介质 计算机 设备 | ||
1.一种蛋白质亚细胞定位方法,其特征在于,包括以下步骤:
S01,获取训练集,所述训练集包括根据蛋白质种类划分为若干子集的亚细胞位置数据;
S02,通过逐一对各子集执行以下步骤,获得各子集的分类器:
S021,以当前子集的亚细胞位置数据作为目标样本,以相对于当前子集的其它子集的亚细胞位置数据作为负样本,将所述目标样本以及负样本映射到特征空间中;
S022,根据预设的弹球损失函数构建针对所述目标样本以及负样本的优化问题,通过求解所述优化问题获得当前子集在所述特征空间中的超球体的球心以及半径,以所述超球体作为当前子集的分类器;
所述弹球损失函数Lτ(x,μ,R)如下:
其中,τ表示弹球损失的参数,向量x表示所述目标样本,向量xi表示第i个所述目标样本,μ表示所述超球体的球心,R表示所述超球体的半径;
所述优化问题按以下公式表示:
其中,C表示松弛变量,C0;
在线性情况下,所述优化问题在代入所述弹球损失函数Lτ(x,μ,R)后表示为如下线性情况的二次规划问题:
s.t.||xi-μ||2≤(1-τ)R2+ξi
i=1,2,...,n;
其中,ξi为第i个松弛向量;n表示所述目标样本的个数;
在非线性情况下,所述优化问题在代入所述弹球损失函数Lτ(x,μ,R)后表示为如下二次规划问题:
s.t.||φ(xi)-μ||2≤(1-τ)R2+ξi
i=1,2,...,n;
其中,ξi为第i个松弛向量;n表示所述目标样本的个数;
S03,获取测试集,所述测试集包括未分类的亚细胞位置数据;
S04,运用各子集的分类器分别对所述测试集进行分类处理,获得所述测试集的分类结果;以所述分类结果作为对所述测试集的各项亚细胞位置数据所对应的蛋白质的预测。
2.根据权利要求1所述的蛋白质亚细胞定位方法,其特征在于,通过以下函数对所述线性情况的二次规划问题进行求解:
其中,αi、αj表示拉格朗日乘子,αi>0,aj>0;
3.根据权利要求1所述的蛋白质亚细胞定位方法,其特征在于,通过以下函数对所述非线性情况的二次规划问题进行求解:
其中,αi、αj表示拉格朗日乘子,αi>0,αj>0;
其中,核函数K(xi,xj)=φ(xi)·φ(xj)。
4.根据权利要求2或3所述的蛋白质亚细胞定位方法,其特征在于,完成对应的二次规划问题的求解后,通过以下公式获得所述超球体的球心μ以及半径R:
其中,集合N={i|0<αi<C}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011316678.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式远程IO模块
- 下一篇:一种环氧树脂胶料摊铺装置及摊铺车