[发明专利]一种疾病知识图谱构建方法和平台系统、设备、存储介质在审
申请号: | 201811205974.8 | 申请日: | 2018-10-17 |
公开(公告)号: | CN109271530A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 蒋小云 | 申请(专利权)人: | 长沙瀚云信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02;G16H70/20 |
代理公司: | 长沙心智力知识产权代理事务所(普通合伙) 43233 | 代理人: | 谢如意 |
地址: | 410006 湖南省长沙市高*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病知识 存储介质 图谱构建 图谱 知识库 快速构建 平台系统 信息抽取 知识表达 知识加工 知识融合 质量评估 歧义 融合 数据源 台系统 多源 整合 抽取 数据库 标准化 规范化 加工 矛盾 学习 | ||
1.一种疾病知识图谱构建方法,其特征在于,包括以下步骤:
A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;
B、知识融合:对知识进行整合,以消除矛盾和歧义;
C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。
2.根据权利要求1所述的一种疾病知识图谱构建方法,其特征在于,步骤C之后还包括:D、知识图谱的更新。
3.根据1所述的一种疾病知识图谱构建方法,其特征在于,步骤A中所述的多源数据库为开放链接数据库和百科,实体的提取步骤为:
A101、实体学习;
A102、实体对齐学习;
A103、上下位关系学习和整合;进一步地,
步骤A中,属性的提取步骤为:
A201、从开放链接数据集中获取实体的属性;
A202、从在线百科中学习实体的属性,并对实体属性进行往上规约从而生成概念的属性。
4.根据1所述的一种疾病知识图谱构建方法,其特征在于,步骤A中,还包括规则和公理的学习,所述的规则和公理的学习由用户针对领域和应用场景添加相应的规则和公理;优选地,步骤A还包括学习过程中的冲突解决,所述的冲突解决包括冲突检测和冲突解决方法。
5.根据权利要求3所述的一种疾病知识图谱构建方法,其特征在于,A102、实体对齐的学习方法为:先把从百科中学习到的实体中描述同一目标的内容进行合并,再把经过合并后的结果实体集与从开放链接数据中抽取的实体进行合并;优选地,步骤A103上下位关系学习和整合包括:从开放链接数据集中抽取上下位关系、从百科中抽取上下位关系、基于CRF的开放上下位关系学习和分类树整合;优选地,步骤D中所述知识图谱的更新包括数据模式层的更新和数据层的更新。
6.根据权利要求7所述的一种疾病知识图谱构建方法,其特征在于,所述从百科中学习到的实体中描述同一目标的内容进行合并包括:基于百科结构化数据的百科实体对齐方法、基于自监督的百科实体对齐方法、基于语言学模式的方法和基于CRF的开放同义关系学习;进一步地,所述基于自监督的百科实体对齐方法包括以下步骤:选择候选实体,对每个候选实体进行特征选取,自动生成训练语料,语料构建完成后,训练模型,训练完成后,采用支持向量机进行判别,对目标数据修订本进行预测,目标数据集合的格式和训练文件的格式一致,使用命令svmpredict完成。
7.根据权利要求6所述的一种疾病知识图谱构建方法,其特征在于,所述的冲突检测的方法包括概念与实体的区分,上下位关系中的冲突和单值型属性冲突;优选地,所述的冲突解决方法包括一种是基于数据源可靠性的方法,第二种是基于支持因素数目的方法,第三种则是基于人工解决的方法。
8.一种疾病知识图谱平台系统,其特征在于,根据权利要求1-13所述的一种疾病知识图谱构建方法,包括信息抽取模块,用于从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;知识融合模块:用于对知识进行整合,以消除矛盾和歧义;知识加工模块:用于对于经过融合的知识,经过质量评估之后,加入到知识库中;优选地,还包括知识图谱的更新模块,用于更新知识图谱的数据模式层和数据层。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-7中任一项所述的方法。
10.一种存储有计算机程序的存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙瀚云信息科技有限公司,未经长沙瀚云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811205974.8/1.html,转载请声明来源钻瓜专利网。