[发明专利]GPCR药物靶标生物学功能预测方法及其应用有效
申请号: | 201810217494.7 | 申请日: | 2018-03-16 |
公开(公告)号: | CN108388767B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 吴建盛;殷勤 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 蒋慧妮 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpcr 药物 靶标 生物学 功能 预测 方法 及其 应用 | ||
本发明提供了一种GPCR药物靶标生物学功能预测方法及其应用,所述预测方法包括如下步骤:先获取GPCR特征信息,并将各特征信息形成对应视图;利用归纳矩阵补全的方法针对GPCR的特征视图进行性能评价,找出对于模型构建有效的特征信息;补全除已知部分GPCR‑GO关系矩阵外的潜在的GPCR‑GO关系,从而寻找Pij=0中存在真实关系的部分,用于预测GPCR的生物学功能。本发明采用基于多视图的归纳矩阵补全(IMC)算法,在考虑样本GPCR的特征的同时也加入了标记的特征。并且实验结果表明,和传统的矩阵补全算法对比,我们的性能都得到了明显的提高。解决了现有技术中多标记算法严重的类不平衡问题。
技术领域
本发明机器学习预测技术领域,尤其涉及GPCR药物靶标生物学功能预测方法及其应用。
背景技术
G蛋白偶联受体(GPCR)是一种七跨膜结构域受体,是细胞信号传导中的重要蛋白质,它在人类视觉、嗅觉、味觉以及神经传递等各项正常生理活动和疾病过程中都发挥着重要的作用。当与细胞膜外的适当配体结合时,激活G蛋白可用于传导细胞外部的信号。G蛋白偶联受体(GPCR)是靶酶中的一种,是多种药物的靶标。现代新药研究与开发的关键首先是寻找、确定和制备药物筛选靶-分子药靶。药物靶标是指药物在体内的作用结合位点,包括基因位点、受体、酶、离子通道、核酸等生物大分子。确定新的有效药靶是新药开发的首要任务。迄今已发现作为治疗药物靶标的总数约500个,而G蛋白偶联受体(GPCR)靶标占其中受体的45%。但仍存在一部分不知道内源配体的孤儿GPCR。
G蛋白偶联受体(GPCR)药物靶标与配体(Ligand)药物的结合有很大的重要性,然而许多G蛋白偶联受体(GPCR)已存的结构、序列、生物信息不足(尤其是结构信息的缺失),导致大多数G蛋白偶联受体(GPCR)并不知道它的配体。
在传统的矩阵补全方法中,存在大量蛋白质的生物学功能的预测方法,但针对于GPCR的生物学功能的预测方法较少。利用传统的矩阵补全算法时,由于有的GPCR是新出现的,尚未发现其生物学功能,因此在关系矩阵中会出现空行或空列的问题。于是,出现了利用机器学习方法进行预测,但传统的机器学习方法将蛋白质的功能预测看作是多标记学习的问题,只考虑了样本空间的特征,没有考虑标记空间的特征,依旧存在准确性不佳的问题。
同时,数据的表示问题是机器学习的重点和难点问题之一,但由于学习效果往往受到数据表示方法的影响。对于客观世界的对象,常常提取它的特征,然后用特征向量表示此对象,即xi={x1,x2,…,xn}了,其中n代表特征的个数。
人们希望提取的特征体现了此对象的本质,从而能够用这些特征学习到目标概念。然而,对于一个学习问题,需要的最小特征集是不可知的,在缺乏先验信息的情况下,只能提取尽可能多的特征,提供给学习器,期望学习器能获得更好的预测性能,另外,数据收集技术的发展,使得人们可以通过更加复杂多样的手段对事物进行描述,这也导致数据的特征较多。但这些描述对象的特征中,有些特征具有不同的属性,因此不适合使用同一种学习器进行学习。
对很多GPCR蛋白质,目前知道的有用信息很少,已发表文献中难以直接得到它们的生物学功能信息,文献中更多是隐含的生物学功能信息或关联信息。
在GPCR的生物学功能的关系中,由于有的GPCR的标记很多,而有的标记则很少,因此存在着严重的类不平衡问题。在一些实际问题中,对于同一事物可以从多种不同的途径或不同的角度对其进行描述,多种描述构成了事物的多个视图(multi view)。多视图数据从多个角度刻画同一物体,包含了比传统的单视图数据更加丰富的分类识别信息。但不同视图数据往往存在一定的信息冗余,如何充分地从多视图数据中提取有用特征并且消除冗余也成为了多视图学习技术的关键问题。
发明内容
本发明的目的在于设计了一种基于多视图的矩阵补全方法,利用GPCR的多种边缘特征信息,找到一个最优的特征组合,实现最优的GPCR的生物学功能预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810217494.7/2.html,转载请声明来源钻瓜专利网。