[发明专利]一种基于图谱聚类的大宗运输需求分解方法有效
申请号: | 202111455280.1 | 申请日: | 2021-12-01 |
公开(公告)号: | CN114358287B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 许丹 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06K9/62;G06Q10/06;G06Q10/08 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 李冲 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图谱 大宗 运输 需求 分解 方法 | ||
1.一种基于图谱聚类的大宗运输需求分解方法,其特征在于,包括以下步骤:
S1:运输对象知识库的构建阶段,优选数据源,从结构化、半结构化、非结构化数据中抽取实体、属性及关联关系,采用人机结合的方式进行知识消歧和融合,形成团体组织、运输装备等知识库;
S2:构建运输需求知识图谱阶段,首先确定是人装分离、人装混合,是否考虑人员装备物资的各类关联关系,据此从知识库中查询实体,筛选考虑的实体关联属性,形成大宗运输需求知识图谱;
S3:图谱聚类分析阶段,然后查看确认各类实体的属性以及关联关系,为各类实体、关联关系赋予不同的优先级权重、关联运输权重;然后调用图谱聚类算法,形成大宗运输的分级需求;
S4:分析结果的导出阶段,将前几阶段形成的知识图谱导出,形成报表、文档等规范化格式,展示大宗运输的分级需求;
所述步骤S1具体为:通过运输对象知识元数据定义模块、运输对象实体抽取模块、运输对象关系抽取模块、运输对象属性提取模块、运输对象知识融合模块,定义运输对象中人员、组织、物资、装备、设备等模型相关的数据字典,用于:1)从各类组织编制、人员装备编配文件中提取各类投送实体信息;2)从各类装备手册、设备手册、人员信息表中提取各类实体属性信息;3)从条令文件、流程文件、历史案例中提取实体之间的指挥关系、隶属关系、保障关系、从属关系、任务关联关系、部署关系、运输规避关系等实体关系;4)对提取实体信息的共指实体进行融合消解,对同名实体进行消歧;
所述步骤S2具体为:通过运输对象信息查询筛选、运输对象关系筛选、运输需求知识图谱动态展示编辑三个模块,用于:1)按组织机构名称查询组织机构下的实体,按照人员、装备、物资等类型筛选实体,明确人装分离、人装混合等运输需求;2)按照指挥关系、隶属关系、保障关系等实体关系筛选实体关系,明确运输装载、编队需求内在的要求;3)自动布局展示投送需求的复杂网络图谱,支持对图谱中实体和关系的修改编辑;
所述步骤S3包括:
S31:模块化分解建模:模块划分解建模是将待分解的知识图谱转换成一个无向图,将各运输需求图谱实体转换成图节点,将运输需求图谱关系转换成图连接,将关系等级转换为图的连接权重;这里采用无向图拉普拉斯矩阵,将运输对象模块化分解转换为无向权重图的切图问题,对于任意两个子图点的集合定义A,B之间的切图权重为:
对于k个子图点的集合:A1,A2,…Ak,定义切图的直接代价函数为
其中为Ai的补集,为除Ai子集外其他V的子集的并集;
S32:将权重转化为边的数量,假设权重单位为1,如果有一条边的权重是2,可以将这条边拆分为两条边,每条权重保持为1,重新构建网络图;
所述模块化分解的方法可采用以下3种的其中一种:
(1)RatioCut代价描述:
RatioCut代价函数为了避免最小切图,对每个切图,不光考虑最小化Cut(A1,A2,…Ak),它还同时考虑最大化每个子图点的个数
其中|Ai|为Ai中点的个数,除以这个值相当于对切图每个图的cost做了均衡,避免切割过于细,相对于cut函数,切割后的子图内多一些节点;
(2)Ncut代价描述:
Ncut代价函数和RatioCut代价函数类似,把Ratiocut的分母|Ai|换成vol(Ai),
其中vol(·)定义为
vol(Ai)即为子图Ai所有边的权重的和;
(3)模块度的代价描述
模块度的概念,首先基于以下定义:假设网络图被划分为A1,A2,…Ak等k个子图,那么定义一个k×k的对称矩阵E,它的元素eij表示子图i和子图j之间边的数量占总边数的百分比,矩阵的迹Tr€=∑ieii表示在相同子图内节点之间的边集合,子图划分的好,也就是模块内部节点之间联系紧密,那么该值就越高。考虑到仅通过这一个值还不能完全反映子图划分的结构,因为如果把网络图划分成1个子图,必然出现Tr€=1,与预期不符,因此增加定义一个度量ai=∑jeij表示所有连接到子图i的边的数量,
将模块度定义为:
将上式展开可以得到
其中,‖X‖表示矩阵X的所有元素的和;
依据定义可推导得到矩阵计算形式:
其中,δ(ci,cj)用于判断节点i和j是否是同一个子图内,在同一子图内,δ(ci,cj)=1,否则δ(ci,cj)=0;
S33模块化分割最优化问题可理解为在给定r的条件下,求满足定义的矩阵S,使得Q最大
B矩阵是实对称矩阵,令其特征分解为B=U∧UT,特征值分别为B1,B2,…Bn,则只需构造S使得UTS选择出前r个最大特征值对应的单位特征向量;
所述S4需求分解信息导出工具包括需求模块报表生成、需求模块报告生成等模块,用于:1)依据模块化分解结果,提取需求知识图谱信息,生成需求模块报表;2)依据文档模板,生成需求分解报告文档。
2.根据权利要求1所述的一种基于图谱聚类的大宗运输需求分解方法,其特征在于,所述S33中,利用经典谱聚类的算法求解出最佳构造方法,其步骤如下;
输入:网络图的邻接矩阵B,类别数r;
步骤1:计算每个节点的度,建立度矩阵D;
步骤2:计算拉普拉斯矩阵B;
步骤3:计算拉普拉斯矩阵B的前r个特征向量;
步骤4:将前r个特征向量作为列向量组成特征矩阵;
步骤5:将特征矩阵的每一行作为数据点,利用Kmeans聚类算法,对数据进行聚类;
输出:模块划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111455280.1/1.html,转载请声明来源钻瓜专利网。