[发明专利]情报知识融合系统及方法在审
申请号: | 201911142507.X | 申请日: | 2019-11-20 |
公开(公告)号: | CN111159328A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 李德启;谢彬;吴剑涛;姜鑫;牛硕硕;刘太林;邱定 | 申请(专利权)人: | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06F16/36;G06F40/295 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 201800 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情报 知识 融合 系统 方法 | ||
本发明提供了一种情报知识融合系统及方法,包括:文本信息与知识库融合模块:将文本中抽取出来的知识融入到现有知识库中;知识库与知识库融合模块:将新知识库中的知识融入到现有知识库中。本发明提出的信源可信度计算方法,显著提升了信源可信度计算方法的效率,提出的基于动态分区索引的多源知识库融合的新方法,显著提升了知识融合的计算效率。
技术领域
本发明文本分析技术领域,具体地,涉及一种情报知识融合系统及方法。
背景技术
知识融合是知识图谱创建过程中的一个重要环节。构建知识图谱的数据往往是多源异构数据,这使得知识融合面临着很多问题需要解决。本方案提出了以下两个主要问题的解决方案。
1、网络情报的可信度计算及其计算效率问题;
2、多源知识库融合的融合效率问题。
对于第一个问题,本方案提出了基于RNN和变长时间序列的网络情报文本可信度计算,将帖子按照一定时间间隔进行分组,然后每组作为时间序列的一个单元进行训练。
对于第二个问题,本方案提出了分区索引技术,在知识库对齐中建立索引是通过剪枝过滤掉知识库中不可能相似的实体对,使得相似的实体对尽量分配到一个或几个区块中成为候选对,最终的对齐处理只在这些候选对中进行,从而达到提高匹配效率的目的。本方案为了同时考虑到属性和关系对索引的分区的影响,将采用动态索引方法进行分区。
经查阅专利文献我们发现,相关对比技术存在的缺陷如下:
1、没有考虑从文本中如何融合知识,只考虑到两个知识库之间的融合,进而就没有考虑到信息源的可信度计算问题。本方案提出了从文本中提取知识并和知识库融合的方法和过程,并提出了高效的可信度计算算法,从而实现了知识库的增量式更新,这对于知识图谱的增量式构建具有根本性的意义。
2、多源知识库融合,采用聚类的方法,当知识库容量比较大(千万级)时,时间消耗会十分巨大;而KNN聚类算法本身是跟知识库容量的平方成正比的,在实际使用中会十分低效。动态分区索引技术可以显著提升融合时实体匹配的效率。
相关检索结果1:
申请(专利)号:CN201910025114名称:知识融合方法、装置、计算机设备和存储介质
摘要:本申请涉及知识图谱技术领域,尤其涉及一种知识融合方法、装置、计算机设备和存储介质,包括:获取知识数据来源中的数个知识数据;抽取任一所述知识数据中的实体数据,将所述实体数据进行向量化转换,生成多维词向量;将所述多维词向量进行降维后得到二维词向量,将所述二维词向量转置后与原所述二维词向量乘积得到实体数据矩阵,所述实体数据矩阵中的元素为向量化的实体数据;获取所述真实属性数据的属性值;将所述实体数据矩阵中的元素和所述真实属性数据的属性值入参到可信度识别模型,出参后得到所述知识数据的可信度,将所述可信度与预设的可信度阈值进行比较后进行融合。本申请实现了同一实体中多个属性的有效融合。
技术要点比较:
1.可信度计算方法:都提到了可信度计算。该专利所提及的可信度方法是和知识库中的实体进行比较,而我们提出的方法是直接根据信源中的上下文评论来计算信源的可信度。我们的方法更具客观性。因为知识库中先入的知识并不能被假定就更真实、准确,不宜作为参照标准。
2.实体匹配的效率问题:该专利采用的是计算复杂度很高的Kmeans聚类方法,未考虑实际应用中的效率问题。如果是两个比较大的知识库融合,实体匹配将是很耗时的计算。我们提出的动态分区索引的方法会显著提升效率。
相关检索结果2:
申请(专利)号:CN201810443980名称:一种基于多源数据的知识融合方法
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东计算技术研究所(中国电子科技集团公司第三十二研究所),未经华东计算技术研究所(中国电子科技集团公司第三十二研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911142507.X/2.html,转载请声明来源钻瓜专利网。