[发明专利]一种高通量基于计算预测弹性蛋白质的方法在审
申请号: | 202210428570.5 | 申请日: | 2022-04-22 |
公开(公告)号: | CN116402172A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 张健;谢晓;赵鹏 | 申请(专利权)人: | 信阳师范学院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16B35/00;G06F18/23 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 梁静 |
地址: | 464000 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通量 基于 计算 预测 弹性 蛋白质 方法 | ||
本发明公开了一种高通量基于计算预测弹性蛋白质的方法,包括获取弹性蛋白质基准数据集以及非弹性蛋白质基准数据集,并将该弹性蛋白质基准数据集以及该非弹性蛋白质基准数据集中的一部分数据作为训练集,利用训练集计算获取富集motif集合;渐次输入富集motif集合中的每一个富集motif对未知的蛋白质序列进行扫描,根据扫描结果判断该未知的蛋白质序列构成潜在的未知弹性蛋白质的概率。本发明涉及的弹性蛋白质预测方法相较于随机预测弹性蛋白质的方法准确性具有巨大的提高,具有较好的泛化性能,对于定性研究弹性蛋白质和生物学家们的后续研究,提供了丰富的实验数据和理论指导意义。
技术领域
本发明涉及弹性蛋白质的识别技术领域,具体为一种高通量基于计算预测弹性蛋白质的方法。
背景技术
蛋白质是维持生物机体细胞和组织进行各项生理活动的基本元素。弹性蛋白质是广泛存在于生物体内结缔组织中的一种具有弹性的重要蛋白质。弹性蛋白质在人体中主要分布在肺部、韧带、主动脉、皮肤和软骨中。弹性蛋白质是构成弹性纤维的主要成分,其能够维持韧带、皮肤组织和脉管壁的良好弹性和扩张能力,能够在所处的组织器官发生拉伸或收缩之后,恢复原先的形状。除此之外,弹性蛋白质也是脊椎动物的重要承重组织。弹性蛋白质是生物体生皮组织中弹性纤维的主要成分,在维持皮肤弹性方面具有举足轻重的作用。弹性蛋白质相互之间还可以发生交互连接,形成富于弹性的网状结构,它们通过共价键形成的交联网络可通过构型的变化产生弹性。随着生物体自身的生长,弹性蛋白质的生产逐渐减慢,皮肤中弹性纤维的降解越来越明显,并会导致皮肤组织出现老化、松弛和褶皱,从而失去弹性。
由于弹性蛋白质在生物体内具有重要的作用,生物学家们在实验室仿照天然弹性蛋白质的特性已经能够人工合成某些弹性蛋白质,并试图通过重组DNA技术设计精确控制微环境适应性和细胞代谢途径,模拟弹性蛋白质的作用效果。正确的识别和检测弹性蛋白质在人体不同组织的分布对于进一步研究人体衰老机制、皮肤的维护保养、血管的硬化、软骨的退化,对相关疾病的早期诊断和治疗具有重要的现实意义。
现有的识别弹性蛋白质的方法主要是基于生物化学实验的方法。该方法主要通过定点突变、质谱分析等技术,鉴定弹性蛋白质。考虑到这些实验步骤繁琐、技术复杂、鉴别效果稳定性差,重复性难以保证等缺点,特别地,某些生物化学实验需要在活体条件下进行探测,考虑到生物体的个体差异性,以及生物化学实验中可能对机体的正常生理活动产生干扰,这些实验的预测结果假阳性偏高。随着当前人类蛋白质组数据库的不断丰富和完善,大量数据涌现出来。因此,研究高效的基于计算的识别弹性蛋白质的方法具有很重要的理论指导意义和现实价值。发展基于计算的方法能够快速高效地识别未知的弹性蛋白质,为进一步的针对性的生物实验提供可靠的数据和信息支撑。但目前尚无针对弹性蛋白质的基于计算的预测方法。
发明内容
本发明的目的在于提供一种高通量基于计算预测弹性蛋白质的方法,用于实现高效的识别未知的弹性蛋白质。
本发明提供了一种高通量基于计算预测弹性蛋白质的方法,包括以下步骤:
获取弹性蛋白质基准数据集DE以及非弹性蛋白质基准数据集DnE;
随机生成多条长度在4~15范围内的短肽片段;
分别计算每条所述短肽片段在弹性蛋白质基准数据集DE上出现的频率相对于在非弹性蛋白质基准数据集DnE上出现的频率的比率Ratiof(i);
当所述短肽片段在弹性蛋白质基准数据集DE上出现的频率相对于在非弹性蛋白质基准数据集DnE上出现的频率的比率Ratiof(i)≥2时,则该短肽片段为富集短肽片段;
计算所述富集短肽片段的信息增益率
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信阳师范学院,未经信阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210428570.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频处理方法与电子设备
- 下一篇:一种电池卷芯入壳电阻焊机
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理