[发明专利]基于拓扑及文献特征的知识关联网络关键节点发现方法有效
申请号: | 202011474017.2 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112650832B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 张兆鹏;孙斌;周宇;龙小刚;赵文成;王静;韩立斌 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 拓扑 文献 特征 知识 关联 网络 关键 节点 发现 方法 | ||
1.一种基于拓扑及文献特征的知识关联网络关键节点发现方法,其特征在于步骤如下:
步骤1、获取文献和实体匹配关系;根据一个研究领域与指定关键词KW1相关的文献库A,与该研究领域的实体名称库,运用多模匹配算法扫描文献库A中的文献,搜索匹配其中待发现实体名称,得到文献库A中每一篇文献匹配到的实体并组成每一篇文献的实体集合;所述实体名称库指该研究领域某方向实体名称全集;
步骤2、建立知识关联网络;将步骤1中得到的所有文献的实体集合取并集得到文件库A的实体集合S,将实体集合S中的所有实体作为知识关联网络中的节点,以步骤1中得到的在文献库中每篇文献的实体集合中任一实体对,作为知识关联网络中的边;
步骤3、计算节点拓扑特征;
步骤4、计算节点文献特征;
步骤5、优选特征集合;根据节点在知识关联网络中的拓扑特征及在文献库中的文献特征,计算各个节点的排名值及排名占比,进而计算Q顺序统计量,将Q顺序统计量给出的排名归一化后作为知识关联网络中节点的重要性分数,称之为Q分数;依据已知的关联实体集合,运用贪婪式选取特征的方式匹配最佳特征集合;
步骤6、将所述最佳特征集合应用于同一科学研究领域与指定关键词KW2相关的文献库X,获取文献库X的关键实体;
所述步骤3中节点拓扑特征包括节点的度中心性、接近中心性、中介中心性、子图中心性和信息中心性指标;
所述步骤3中计算节点拓扑特征的具体步骤如下:
步骤3-1、记实体集合S={s1,s2,…,sn,…,sN},其中N表示所述文件库A的实体集合S的实体总数量,sn表示实体集合S中的实体,1≤n≤N;记Ns为节点sn的邻接点集合,|Ns|为集合Ns的元素个数,根据公式
DC(sn)=|Ns|
计算知识关联网络图中各个节点sn的度中心性DC(sn);
步骤3-2、记dist(sn,v)为知识关联网络中节点sn到任一节点v的最短距离,v∈S,根据公式
计算知识关联网络中各个节点sn的接近中心性CC(sn);
步骤3-3、记ρ(u,t)是从节点u到节点t最短路径的条数,u∈S,t∈S,其中经过节点sn的最短路径条数定义为ρ(u,sn,t),根据公式
计算知识关联网络中各个节点sn的中介中心性BC(sn);
步骤3-4、记μl(sn)是长度为l,起始点为节点sn的闭合路径的条数,根据公式
计算知识关联网络图中各个节点sn的子图中心性SC(sn);
步骤3-5、记D是所有节点的度作为对角线元素,其余元素为0的对角矩阵,A为邻接矩阵,J为所有元素均为1的矩阵,所述D、A和J均为N*N矩阵,根据公式
计算知识关联网络中各个节点sn的信息中心性IC(sn),其中C为计算过程中的N*N矩阵,v表示实体集合S中的任一实体,即知识关联网络中任一节点,表示矩阵C中的元素,为计算过程中的数值,|N|表示知识关联网络中所有节点总数量;
所述步骤4中节点文献特征包括节点出现文献的最早日期、最近日期和出现次数;
所述步骤4中计算节点文献特征的具体步骤如下:
步骤4-1、根据节点与文献的匹配关系,最早出现节点sn的文献日期为Y1年M1月D1日,根据公式OLD(sn)=D1+M1*100+Y1*10000计算节点最早日期文献特征;
步骤4-2、根据节点与文献的匹配关系,最新出现节点sn的文献日期为Y2年M2月D2日,根据公式NEW(sn)=D2+M2*100+Y2*10000计算节点最近日期文献特征;
步骤4-3、根据节点与文献的匹配关系,统计出现节点sn的文献数量,得到节点出现次数文献特征NUM(sn)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011474017.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数字签名方法、数字验签方法、电子设备及存储介质
- 下一篇:烟具