[发明专利]一种融合多源生物信息的关键蛋白质识别方法在审

专利信息
申请号: 202111349828.4 申请日: 2021-11-15
公开(公告)号: CN114067906A 公开(公告)日: 2022-02-18
发明(设计)人: 刘维;唐玉亮 申请(专利权)人: 扬州大学
主分类号: G16B20/00 分类号: G16B20/00;G16B25/00;G16B40/30;G06K9/62
代理公司: 扬州苏中专利事务所(普通合伙) 32222 代理人: 许必元
地址: 225100 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 生物 信息 关键 蛋白质 识别 方法
【权利要求书】:

1.一种融合多源生物信息的关键蛋白质识别方法,其特征在于,所述识别方法包括如下步骤:

(1)输入PPI网络和基因表达数据、GO注释数据、亚细胞定位数据,其中,GO为蛋白质生物功能的注释属性;

(2)根据静态PPI网络和蛋白质基因表达值数据集,利用3σ法则构建多个动态子网络;

(3)对于任一子网中的任一节点u来说,计算出该节点的点边缘聚类系数值DEcc(u,v),最后求该节点与其所有邻居之间的点聚类系数值之和Sum_DEcc(u);

(4)对于任一子网中的任一节点u来说,计算出该节点与邻居节点之间的基因共表达值PCC(u,v),最后求该节点与其所有邻居之间的共表达系数之和Sum_PCC(u);

(5)对于任一子网中的任一节点u来说,计算出该节点的亚细胞定位得分值SLS(u),最后求该节点与其邻居之间的亚细胞定位得分值之和Sum_SLS(u);

(6)对于任一子网中的任一节点u来说,计算出该节点与邻居节点之间的Go注释值Go(u,v),最后求该节点与其所有邻居之间的共表达系数之和Sum_Go(u);

(7)对于每一个节点u来说,将上述的属性值进行相加,得到蛋白质u的最终关键性得分值Ess_Pro(u);

(8)最后将蛋白质节点按Ess_Pro(u)的值从大到小排序输出。

2.根据权利要求1所述的融合多源生物信息的关键蛋白质识别方法,其特征在于,步骤(2)中,根据静态PPI网络和蛋白质基因表达值数据集,利用3σ法则构建多个动态子网络;根据基因表达值数据集,可以计算出每个蛋白质的活跃阈值Tg,再结合静态网络的拓扑属性,可以将静态网络根据时间点划分为多个动态子网络;每个蛋白质的活跃阈值Tg计算过程如公式(1)-(4)所示:

Tg=ug+3ρg(1-Fg) (4)

蛋白质的基因表达值随时间变化而变化,在公式(1)中,N表示每个蛋白质基因的表达值的数量,Gi表示在i时刻某个蛋白质基因的表达值,ug表示某个蛋白质基因表达值的平均值,在公式(2)中,ρg表示的是某个蛋白质基因表达值的标准差的值,在公式(3)中,Fg表示某个蛋白质一组基因表达值的波动性;最后在公式(4)中,Tg表示是某个蛋白质的活跃阈值,也就是说,如果在某个时刻,蛋白质的基因表达值大于这个阈值Tg,就可以说在该时刻,蛋白质是活跃的、表达的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111349828.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top