[发明专利]基于AI技术绘制毒株蛋白质二维谱的方法在审
申请号: | 202010995311.1 | 申请日: | 2020-09-21 |
公开(公告)号: | CN112397138A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 张辉;王利 | 申请(专利权)人: | 内蒙古民族大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 沈阳维特专利商标事务所(普通合伙) 21229 | 代理人: | 王翠 |
地址: | 028000 内蒙古自*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai 技术 绘制 蛋白质 二维 方法 | ||
本发明公开了一种基于AI技术绘制毒株蛋白质二维谱的方法,该方法针对毒株蛋白质序列、结构与音乐在表现形式上的特点,基于AI技术实现了由毒株蛋白质结构生成二维乐谱的方法,从而建立起毒株蛋白质序列与音乐的一一对应关系,以辅助毒株蛋白质的分析研究。该方法将毒株蛋白质以二维谱的方式进行表达后,在进行毒株蛋白质的研究时,既可通过二维谱从视觉上直观看到不同毒株蛋白质的区别之处,也可将二维谱演奏成音乐,从听觉上感知不同毒株蛋白质的不同,为毒株蛋白质的研究提供了一种新的方式方法。
技术领域
本发明公开涉及人工智能应用的技术领域,尤其涉及一种基于AI技术绘制毒株蛋白质二维谱的方法。
背景技术
在生命科学领域,AI技术也逐渐开启无法替代的数据分析地位。蛋白质作为生命体的重要组成,具有序列的多样性和功能结构的复杂性,以致蛋白质研究至今依然是科学家们难以彻底攻破的生命领域。
目前,进行蛋白质表征的方式主要由蛋白质的氨基酸序列以及空间结构等,是否可通过其他形式进行蛋白质的表征,以提升蛋白质的可视化效果,便于分析,成为人们研究的焦点。
发明内容
鉴于此,本发明提供了一种基于AI技术绘制毒株蛋白质二维谱的方法,通过AI技术将毒株蛋白质以二维谱的形式进行表征,在增加蛋白质可视化效果的同时,还将不同的毒株蛋白质与不同的音乐对应,以从视觉和听觉双方面辅助蛋白质的分析研究。
本发明提供的技术方案,具体为,一种基于AI技术绘制毒株蛋白质二维谱的方法,其特征在于,包括如下步骤:
S1:获取毒株蛋白质样本的一级结构以及二级结构;
S2:将所述毒株蛋白质样本的一级结构中的氨基酸序列视为线性排列,形成一维单通道数据;
S3:将所述毒株蛋白质样本的二级结构中四个主链原子在三维空间各坐标系的投影,形成主链骨架原子的三通道数据;
S4:基于生成式对抗网络构建蛋白质生成二维谱模型,采用多个毒株蛋白质样本,分别以音乐风格以及蛋白质序列作为约束条件,进行所述蛋白质生成二维谱模型的训练,获得模型参数;
S5:在步骤S4获得的模型参数下,利用蛋白质生成二维谱模型进行毒株蛋白质的二维谱绘制。
优选,步骤S2中,将所述毒株蛋白质样本的一级结构中的氨基酸序列视为线性排列,形成一维单通道数据,具体为:
依据图像灰度值0~255的取值范围,设置组成蛋白质的20种氨基酸的值为s1~s20;
依据所述毒株蛋白质样本中氨基酸的序列以及所述氨基酸对应的数值,形成一维单通道数据。
进一步优选,步骤S3中,将所述毒株蛋白质样本的二级结构中四个主链原子在三维空间各坐标系的投影,形成主链骨架原子的三通道数据,具体为:
根据图像灰度值0~255的取值范围,设置主链氨基酸骨架原子Cα、C、N、O的值分别为k1、k2、k3和k4;
将四个主链原子在三维空间各坐标系的投影形成主链骨架原子的三通道分布灰度图像,数据为三通道数据。
进一步优选,所述多个毒株蛋白质样本包括:自然毒株蛋白质样本以及采用生成式对抗网络增加的毒株蛋白质样本。
进一步优选,步骤S4中,基于生成式对抗网络构建的蛋白质生成二维谱模型,包括:
二维谱生成器、音乐生成判别器、音乐风格判别器、蛋白质逆生成器以及蛋白质判别器;
所述蛋白质生成二维谱模型的训练过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古民族大学,未经内蒙古民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010995311.1/2.html,转载请声明来源钻瓜专利网。