[发明专利]一种基于语义树的多领域知识融合方法在审
申请号: | 202310550324.1 | 申请日: | 2023-05-16 |
公开(公告)号: | CN116542332A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 刘春冉;权安;葛蕾;陈玮;戎强;刘刚 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06N5/025 | 分类号: | G06N5/025;G06N5/02;G06F16/36;G06F16/31;G06F16/901;G06F18/26 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆 |
地址: | 050081 河北省石家庄市中山西路*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 领域 知识 融合 方法 | ||
1.一种基于语义树的多领域知识融合方法,其特征在于,具体步骤如下:
步骤1,基于大数据的文字资料,针对需要研究的多个知识领域进行建模以及属性填充,并拓展各实体之间的联系,构建层次化的知识语义树,反映不同层次知识的上下级和从属结构;
步骤2,建立多个领域语义树的基础上,针对不同领域的知识特点,提出与之相适应的关联规则挖掘方法,利用已有的文字资料,形成跨层次、跨领域的关联规则,并在此基础上给出关联度强弱的指标;
步骤3,采用FP-growth算法对多领域的知识语义树进行关联分析,快速扫描得出之间的关联规则;
步骤4,基于图运算理论进行关联元素的挖掘与计算,从海量结点中寻找最权威节点和距离目标节点最近的次权威节点;
步骤5,综合多领域的知识树以及针对知识语义树挖掘出的关联规则,融合各领域多方面的特征,根据元素之间的关联关系,构建多领域融合的综合性知识图谱体系,其知识图谱中主干与各分支的统一与相互作用反映各领域知识体系及其要素的关联;
步骤6,采用图数据库进行存储。
2.根据权利要求1所述的一种基于语义树的多领域知识融合方法,其特征在于,所述步骤2中,关联规则用于反应一个事物与其他事物之间的相互依存性和关联性,用于从大量数据中挖掘出有价值的数据项之间的相关关系;
关联规则的关联强度通过支持度、置信度和提升度来进行描述;
确定关联规则的提取过程是找出所有支持度=最小支持度、置信度=最小置信度的关联规则;
挖掘出满足条件的关联规则,可以分两步进行:首先生成频繁项集,即找出所有满足最小支持度的项集,然后在频繁项集的基础上生成满足最小置信度的规则;
通过关联规则挖掘得到不同领域知识之间的相关性,直观反映出多领域知识体系的整体关联程度,为综合知识图谱的建立奠定理论基础。
3.根据权利要求1所述的一种基于语义树的多领域知识融合方法,其特征在于,所述步骤4中,采用互投票方法确定最权威节点,如果知识图谱的数据量非常庞大,采用分块式的方式来实现,先计算每个分块图的PageRank值,根据各数据块之间的相关性,得到新图PageRank值,再反复迭代,分析最权威节点;
采用基于节点属性及节点间关系的多特征方法,将节点属性和关系综合分析来进行权威节点分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310550324.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:夹持工装及拉铆系统
- 下一篇:一种利用煤气化渣生产水泥熟料的方法