[发明专利]一种KEGG数据库的反应信息补充方法有效
申请号: | 201911033691.4 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110797095B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 郝彤;孙金生;赵凌轩 | 申请(专利权)人: | 天津师范大学 |
主分类号: | G16C20/90 | 分类号: | G16C20/90;G16C20/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 kegg 数据库 反应 信息 补充 方法 | ||
本发明涉及生物信息学生物数据分析领域,公开一种KEGG数据库的反应信息补充方法,该技术分为反应方程式配平、主反应补充、途径信息补充和子系统信息补充四个部分。KEGG数据库中下载的反应信息数据存在一定的缺失和遗漏,通过本专利所述方法能够对其中的部分数据信息进行补充,使反应信息更为完善和全面。网络信息更加完整,有利于后续的模拟和生物学分析。
技术领域
本发明涉及生物信息学生物数据分析领域,具体涉及一种KEGG数据库的反应信息补充方法。
背景技术
生物信息学和数据库技术的不断发展,为研究者收集、整合庞大的数据并高效地利用它们解决生物学问题提供了极大的方便。1995年,日本京都大学创建第一个较为全面的代谢数据库——KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库,该数据库收集了已经测序物种的序列信息,并提供相应的功能注释,是一个整合基因组、化学和系统功能信息的数据库。迄今为止,KEGG数据库不断地在扩充、维护和修正数据,为广大研究者提供着最新的代谢信息。
尽管KEGG数据库是国际最常用的生物信息学数据库之一,KEGG数据库中仍然存在一定量的缺失和错误信息,这些缺失的信息对于研究者利用数据解决生物学问题造成了一定的困难。例如在利用KEGG中的反应信息构建基因组尺度代谢网络的过程中,反应信息的缺失会对网络模型的精细度和可计算性造成较大的影响。通过访问KEGG数据的FTP(ftp://ftp.bioinformatics.jp/)网址可批量下载KEGG数据库中反应相关信息的数据。但这些反应信息中存在反应方程式左右侧元素不守恒,部分反应缺失主反应、途径信息,反应未匹配子系统信息等问题,导致了后续利用这些反应进行途径分析、计算机模拟计算和生物学特征分析时存在一定的困难和不精确性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种KEGG数据库的反应信息补充方法。KEGG数据库中下载的反应信息数据存在一定的缺失和遗漏,通过本专利所述方法能够对其中的部分数据信息进行补充,使反应信息更为完善和全面。
本发明为解决背景技术中提及的技术问题,采用的技术方案是一种KEGG数据库的反应信息补充方法,该技术分为反应方程式配平、主反应补充、途径信息补充和子系统信息补充四个部分。
具体的步骤为:
1)反应方程式配平:
(1)统计化合物中的元素个数。从KEGG数据库下载“compound”文件,可获得所有化合物的编号及分子式,筛选出化合物中没有提供分子式和分子式中含有n、x的化合物,此类化合物无法确定准确的元素个数,不在配平范围之内。对于其余可得到确定分子式的化合物,将每个化合物的元素按照碳、氢、氧、氮、磷、硫的顺序进行个数统计。
(2)确定为配平反应。对反应方程式进行拆分,得到未配平的反应方程式。具体方法为:从KEGG数据库下载“reaction”文件,该文件中包含部分反应的反应方程式、主反应和途径信息。对于其中的每一个反应,将等式左右两侧分为两部分,根据步骤(1)中统计的各个化合物包含的元素个数,乘以该化合物对应的系数,并对单侧的元素总数进行汇总统计,得到反应方程式左右两侧每个元素的总数,并对左右两侧的元素个数进行比较,元素守恒(即左右两侧各元素种类和个数都相等)的为配平反应,元素不守恒(即左右两侧元素种类或个数不相等)的反应即为未配平的反应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津师范大学,未经天津师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911033691.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置