[发明专利]蛋白质亚细胞定位方法、系统、储存介质及计算机设备有效

专利信息
申请号: 202011316678.2 申请日: 2020-11-19
公开(公告)号: CN112259160B 公开(公告)日: 2023-05-26
发明(设计)人: 钟光正;肖燕珊;刘波 申请(专利权)人: 广东工业大学
主分类号: G16B20/00 分类号: G16B20/00;G06F18/214;G06N20/00
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 张金福
地址: 510090 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 蛋白质 细胞 定位 方法 系统 储存 介质 计算机 设备
【权利要求书】:

1.一种蛋白质亚细胞定位方法,其特征在于,包括以下步骤:

S01,获取训练集,所述训练集包括根据蛋白质种类划分为若干子集的亚细胞位置数据;

S02,通过逐一对各子集执行以下步骤,获得各子集的分类器:

S021,以当前子集的亚细胞位置数据作为目标样本,以相对于当前子集的其它子集的亚细胞位置数据作为负样本,将所述目标样本以及负样本映射到特征空间中;

S022,根据预设的弹球损失函数构建针对所述目标样本以及负样本的优化问题,通过求解所述优化问题获得当前子集在所述特征空间中的超球体的球心以及半径,以所述超球体作为当前子集的分类器;

所述弹球损失函数Lτ(x,μ,R)如下:

其中,τ表示弹球损失的参数,向量x表示所述目标样本,向量xi表示第i个所述目标样本,μ表示所述超球体的球心,R表示所述超球体的半径;

所述优化问题按以下公式表示:

其中,C表示松弛变量,C0;

在线性情况下,所述优化问题在代入所述弹球损失函数Lτ(x,μ,R)后表示为如下线性情况的二次规划问题:

s.t.||xi-μ||2≤(1-τ)R2i

i=1,2,...,n;

其中,ξi为第i个松弛向量;n表示所述目标样本的个数;

在非线性情况下,所述优化问题在代入所述弹球损失函数Lτ(x,μ,R)后表示为如下二次规划问题:

s.t.||φ(xi)-μ||2≤(1-τ)R2i

i=1,2,...,n;

其中,ξi为第i个松弛向量;n表示所述目标样本的个数;

S03,获取测试集,所述测试集包括未分类的亚细胞位置数据;

S04,运用各子集的分类器分别对所述测试集进行分类处理,获得所述测试集的分类结果;以所述分类结果作为对所述测试集的各项亚细胞位置数据所对应的蛋白质的预测。

2.根据权利要求1所述的蛋白质亚细胞定位方法,其特征在于,通过以下函数对所述线性情况的二次规划问题进行求解:

其中,αi、αj表示拉格朗日乘子,αi>0,aj>0;

3.根据权利要求1所述的蛋白质亚细胞定位方法,其特征在于,通过以下函数对所述非线性情况的二次规划问题进行求解:

其中,αi、αj表示拉格朗日乘子,αi>0,αj>0;

其中,核函数K(xi,xj)=φ(xi)·φ(xj)。

4.根据权利要求2或3所述的蛋白质亚细胞定位方法,其特征在于,完成对应的二次规划问题的求解后,通过以下公式获得所述超球体的球心μ以及半径R:

其中,集合N={i|0<αi<C}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011316678.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top