[发明专利]一种面向突发事件的知识图谱构建方法有效
申请号: | 201711158208.6 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107704637B | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 刘忠;霍家欣;王涛;冯旸赫;程光权;黄金才;陈发君;朱先强 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 43225 长沙国科天河知识产权代理有限公司 | 代理人: | 董惠文 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种面向突发事件的知识图谱构建方法,包括以下步骤:从互联网上收集文档数据,并同时判断文档数据质量以决定是否进行深层次收集;从所收集文档数据中抽取出突发事件的实体和关系,通过匹配将实体用关系连接起来;将所抽取的实体聚成多个实体簇,构建突发事件的知识图谱模式层;构建实体簇中每个实体的子图谱;最后合并子图谱,得到面向突发事件的知识图谱。本发明将知识图谱引入突发事件领域,有助于突发事件的知识查询学习和在突发事件发生后辅助应急方案的制定,本发明方法可提高数据的获取质量和获取效率,减少人力成本,降低构建知识图谱的复杂性,并提升构建知识图谱的质量。 | ||
搜索关键词: | 一种 面向 突发事件 知识 图谱 构建 方法 | ||
【主权项】:
1.一种面向突发事件的知识图谱构建方法,其特征在于:包括以下步骤:/n步骤1:使用框架爬虫技术从互联网上收集与突发事件相关的文档数据,并通过基于TFIDF文档相似度的方法判断文档数据质量,决定是否继续进行深层次链接文档数据爬取;/n步骤2:建立突发事件领域的分词词库和停用词词库,将分词词库中描述突发事件的实体以及连接实体之间的关系分别标记为名词和动词,并根据标记的名词和动词从所收集的文档数据中抽取突发事件的实体和关系,通过匹配将实体用关系连接起来;/n步骤3:构建本体,通过聚类操作将所抽取的实体聚成多个不同的实体簇,每个实体簇包含若干个实体,对比百科中该突发事件词条的描述结构构建出该突发事件的知识图谱模式层;/n步骤4:根据步骤2中所抽取的突发事件的实体和关系,找到与实体簇中某个实体对应的文档,并通过K-近邻方法找出该实体对应的文档中与该实体相近的描述词,通过匹配建立实体与相近描述词的关系,得到子图谱;/n步骤5:合并子图谱,连接所有子图谱,完成知识合并,得到面向突发事件的知识图谱;/n所述步骤1中基于TFIDF文档相似度的方法判断文档数据质量的具体步骤是:/n步骤1.1:建立数据质量判断模型,如公式(1)所示:/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711158208.6/,转载请声明来源钻瓜专利网。