[发明专利]蛋白质亚细胞定位方法、系统、储存介质及计算机设备有效

专利信息
申请号: 202011316678.2 申请日: 2020-11-19
公开(公告)号: CN112259160B 公开(公告)日: 2023-05-26
发明(设计)人: 钟光正;肖燕珊;刘波 申请(专利权)人: 广东工业大学
主分类号: G16B20/00 分类号: G16B20/00;G06F18/214;G06N20/00
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 张金福
地址: 510090 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 蛋白质 细胞 定位 方法 系统 储存 介质 计算机 设备
【说明书】:

本发明提出了一种蛋白质亚细胞定位方法、系统、储存介质及计算机设备,将弹球损失函数引入离群点检测算法中来处理蛋白质亚细胞定位的数据;其抗噪效果好,特别是对边界噪声不敏感;约束数量少,计算复杂度低,运算效率高;能够兼顾子集内最小化,所得到的超球体的球心处于数据密集的区域;因而能够快速处理蛋白质亚细胞定位的数据,并相应得到准确、可靠的预测结果。

技术领域

本发明涉及机器学习算法技术领域,具体涉及离群点检测算法在蛋白质亚细胞定位上的应用,更具体地,涉及一种蛋白质亚细胞定位方法、系统、储存介质及计算机设备。

背景技术

离群点检测(Outlier Detection)是一种机器学习算法,广泛运用于故障检测、网络入侵检测、生化分析、自动货币验证、动态身份验证等多种领域;离群点检测的应用,在于通过对各领域中的数据集进行训练得到对应的分类器,以此用于满足相关的应用需求。

蛋白质亚细胞定位(Protein Subcellular Localization,PSL)是离群点检测的其中一个具体的应用领域。细胞可以分成多个细胞器或者细胞区域,如细胞膜、细胞质、细胞核、线粒体等,这些细胞器被称为“亚细胞”。由于同种蛋白质会较为固定地分布在某一特定区域,因而可以利用由离群点检测得到的分类器对已知的亚细胞位置数据进行处理,预测这些亚细胞位置数据所具体对应的蛋白质。

公告日为2017-01-03,公告号为US9536208B1的美国专利:Kernel parameterselection in support vector data description for outlier identification中提供了一种基于支持向量数据描述(Support Vector Data Description,SVDD)的离群点检测方案;SVDD的原理为:将目标样本以及负样本从原始空间映射到特征空间,通过求解结合了损失函数的优化问题在特征空间中构建一个包含大多数目标样本的、尽量小、尽量紧密的超球体,包括超球体的圆心以及半径,以超球体作为分类器对测试数据进行处理。但是,现有的SVDD应用在蛋白质亚细胞定位时经常出现准确率差的问题。

发明内容

针对现有技术的局限,本发明提出一种蛋白质亚细胞定位方法、系统、储存介质及计算机设备,本发明采用的技术方案是:

一种蛋白质亚细胞定位方法,包括以下步骤:

获取训练集,所述训练集包括根据蛋白质种类划分为若干子集的亚细胞位置数据;

通过逐一对各子集执行以下步骤,获得各子集的分类器:

以当前子集的亚细胞位置数据作为目标样本,以相对于当前子集的其它子集的亚细胞位置数据作为负样本,将所述目标样本以及负样本映射到特征空间中;

根据预设的弹球损失函数构建针对所述目标样本以及负样本的优化问题,通过求解所述优化问题获得当前子集在所述特征空间中的超球体的球心以及半径,以所述超球体作为当前子集的分类器;

获取测试集,所述测试集包括未分类的亚细胞位置数据;

运用各子集的分类器分别对所述测试集进行分类处理,获得所述测试集的分类结果;以所述分类结果作为对所述测试集的各项亚细胞位置数据所对应的蛋白质的预测。

相较于现有技术,本发明将弹球损失函数引入离群点检测算法中来处理蛋白质亚细胞定位的数据;其抗噪效果好,特别是对边界噪声不敏感;约束数量少,计算复杂度低,运算效率高;能够兼顾类内最小化,所得到的超球体的球心处于数据密集的区域;因而能够快速处理蛋白质亚细胞定位的数据,并相应得到准确、可靠的预测结果。

作为一种优选方案,所述弹球损失函数Lτ(x,μ,R)如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011316678.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top