[发明专利]一种基于PageRank和起源图抽象的关键视图发现方法有效

专利信息
申请号: 201611197595.X 申请日: 2016-12-22
公开(公告)号: CN106709000B 公开(公告)日: 2020-07-14
发明(设计)人: 许国艳;杨少松;王诗玉 申请(专利权)人: 河海大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9536;G06F16/901
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 梁耀文
地址: 210098 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 pagerank 起源 抽象 关键 视图 发现 方法
【说明书】:

发明公开一种基于PageRank和起源图抽象的关键视图发现方法,包含以下步骤:首先,提出基于PageRank算法得到基于节点分组的起源图中关键节点识别的思想,根据PROV图的特性对PageRank算法进行改进,制定关键节点发现策略得到该用户对应的图中的关键节点;然后,通过分区算法对非关键节点进行“分区”;最后通过图抽象技术对PROV图进行“抽象”,从而得到关键视图,并通过实验验证了该思想的可行性。本发明可以根据不同用户对信息重要性定义不同,为不同用户生成不同关键视图,即可以快速的根据用户的需要发现图中的主要信息。

技术领域

本发明属于大数据领域,特别涉及一种基于PageRank和起源图抽象的关键视图发现方法。

背景技术

随着大数据的不断发展,为了方便用户快速访问图中重要信息,需要求得起源图中的关键视图,由于不同用户对起源信息关注程度不同,因此,不同用户对信息重要性定义不同。通过关键节点识别技术求得每个节点的影响力,其次制定关键节点发现策略根据用户的需要提取关键节点,然后通过分区算法对非关键节点进行分区,最后得到该用户对应的关键视图。

发明内容

发明目的:针对不同用户对起源图中信息关注程度不同生成不同关键视图的问题,本发明提出一种基于PageRank和起源图抽象的关键视图发现方法,

步骤一:根据W3C起源工作组定义一个数据模型——PROV模型,利用PROV模型使用户对各类系统中数据的起源信息进行标准化描述,将实体En、活动Act、代理Agent以及used和wasGeneratedBy等关系从PROV模型中提取出来建立基于PROV模型的起源图;

步骤二:在步骤一得到的起源图的基础上利用节点分组的概念,提出闭包、扩展、替换、删除等操作,并进行形式化定义和完善,得到符合PROV约束条件的抽象图;

步骤三:提出了基于PageRank算法的关键节点识别算法,针对PROV起源图无环性的特性对PageRank算法进行改进,求出步骤二中得到的抽象图中所有节点的关键度;

步骤四:当用户对起源信息进行查看时,指定访问等级s(n)和节点类型,利用步骤三中得到的抽象图中节点关键度与指定访问等级的节点以及指定类型的节点进行比较,得到关键节点和非关键节点。同时将非关键节点标记为抽象节点,从而得到需要抽象的点的集合R。

步骤五:将步骤四中得到的需要抽象的点的集合R经过最优分区算法和图转换算法,最终得到对应用户对应的关键视图。

进一步的,所述步骤二中所述的节点分组是定义图形的编辑操作,即如何将指定节点从原起源图中移除,生成一个新的有效的起源图;抽象图是指将用户指定的一系列节点看作一组,然后用一个新的抽象节点替换,同时通过修改节点以及新的抽象节点之间的关系,得到一个新的图。

进一步的,所述步骤二中所述的符合PROV约束条件的抽象图的构建步骤具体如下:

步骤1.1:PROV起源图研究只包含实体En和活动Act以及used和wasGeneratedBy的关系,针对抽象节点都是同一类型的作为同质分组进行操作,针对抽象节点不是同一类型的作为异质分组进行操作;

其中同质分组通过闭包、扩展、替换和删除四种操作来将新的抽象节点与原节点进行替换,并形成新的节点之间的相互关系;

步骤1.2:通过以下四个约束条件对抽象图进行进一步修改得到最终正确的抽象图;

其中四个约束条件为:

5)如果一个实体由两个及以上的活动产生,那么这些活动需同时发生;

6)实体必须生成后才能使用;

7)活动使用实体必须发生在活动发生的过程中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611197595.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top