[发明专利]一种基于病毒蛋白质本体的知识导航的方法、装置有效
申请号: | 201310391096.4 | 申请日: | 2013-08-30 |
公开(公告)号: | CN104424399B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 陈恒;张珅;赵衍;张永娟;陈成材 | 申请(专利权)人: | 中国科学院上海生命科学研究院 |
主分类号: | G06F19/28 | 分类号: | G06F19/28 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 施浩 |
地址: | 200031 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 病毒 蛋白质 本体 知识 导航 方法 装置 系统 | ||
1.一种基于病毒蛋白质本体的知识导航的方法,包括病毒知识挖掘的流程以及专题文献数据库中的蛋白质挖掘和发现的流程,其中:
病毒知识挖掘的流程进一步包括:
构建专题文献知识数据库和确立能够进行对应的蛋白质关联和整合的科学数据型数据库;
以现存的蛋白质科学数据型数据库的标准控制词表为依据,以专题文献知识数据库中出现的病毒蛋白质名词为挖掘和发现对象,进行病毒蛋白质相关文本挖掘字典的翻译和编撰;
根据国外蛋白质科学数据型数据库提供的协议将标识号转换成超链接信息,生成面向主题和应用的专题文献知识数据仓库;
专题文献数据库中的病毒蛋白质本体的构建及知识导航流程包括:
提取病毒相关术语;
确立病毒相关术语间的关系;
构建病毒蛋白本体,将知识挖掘型专题文献数据库的文本挖掘字典和病毒蛋白本体进行关联整合,并通过整合关联,构建应用于蛋白质挖掘模块的知识组织与分类导航,完成基于病毒蛋白本体的知识导航功能。
2.根据权利要求1所述的基于病毒蛋白质本体的知识导航的方法,其特征在于,在生成专题文献知识数据仓库的步骤之后还包括:
去除数据挖掘和信息整合结果中的非法信息,去除假阳性蛋白质挖掘结果。
3.根据权利要求1所述的基于病毒蛋白质本体的知识导航的方法,其特征在于,进行病毒蛋白质相关文本挖掘字典的翻译和编撰使得专题文献知识数据库中的病毒蛋白质名词与蛋白质科学数据库的标准控制词表进行一一对应的关联和整合,实现对专题文献基础数据库的病毒蛋白质相关文本的挖掘和标注。
4.根据权利要求1所述的基于病毒蛋白质本体的知识导航的方法,其特征在于,提取病毒相关术语的步骤包括:
通过对病毒生活史的学习和理解,从中提取代表性的术语词汇、蛋白质名称以及对术语词汇的解释和蛋白质功能的注释,并对这些词汇及蛋白质名词进行整理分类,划分为感染过程相关术语、结构组分相关术语以及蛋白质名称。
5.根据权利要求1所述的基于病毒蛋白质本体的知识导航的方法,其特征在于,确立病毒相关术语间的关系的步骤包括:
通过学习与理解,分析提取出的术语间存在的属性关系,并最终确定具有代表性的关系属性。
6.根据权利要求1所述的基于病毒蛋白质本体的知识导航的方法,其特征在于,构建病毒蛋白本体的步骤包括:
将术语、术语注释以及关系属性进行关联整合,构建出一个蛋白本体框架,并最终通过反复分析修改更正来完善该本体。
7.根据权利要求1-6中任一项所述的基于病毒蛋白质本体的知识导航的方法,其特征在于,病毒是乙肝病毒,专题文献知识数据库是乙肝专题文献知识数据库,蛋白本体是乙肝病毒蛋白本体。
8.一种基于病毒蛋白质本体的知识导航的装置,包括病毒知识挖掘模块以及专题文献数据库中的蛋白质挖掘和发现模块,其中:
病毒知识挖掘模块包括:
数据库构建单元,构建专题文献知识数据库和确立能够进行对应的蛋白质关联和整合的科学数据型数据库;
翻译编撰单元,以现存的蛋白质科学数据型数据库的标准控制词表为依据,以专题文献知识数据库中出现的病毒蛋白质名词为挖掘和发现对象,进行病毒蛋白质相关文本挖掘字典的翻译和编撰;
数据仓库生成单元,根据国外蛋白质科学数据型数据库提供的协议将标识号转换成超链接信息,生成面向主题和应用的专题文献知识数据仓库;
专题文献数据库中的病毒蛋白质本体构建及知识导航模块包括:
术语提取单元,提取病毒相关术语;
关系确立单元,确立病毒相关术语间的关系;
本体构建单元,构建病毒蛋白本体,将知识挖掘型专题文献数据库的文本挖掘字典和病毒蛋白本体进行关联整合,并通过整合关联,构建应用于蛋白质挖掘模块的知识组织与分类导航,完成基于病毒蛋白本体的知识导航。
9.根据权利要求8所述的基于病毒蛋白质本体的知识导航的装置,其特征在于,病毒知识挖掘模块还包括:
非法信息去除单元,去除数据挖掘和信息整合结果中的非法信息,去除假阳性蛋白质挖掘结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海生命科学研究院,未经中国科学院上海生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310391096.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法及电子设备
- 下一篇:一种自动监管的方法和装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用