[发明专利]基于随机游走人员亲密度的计算系统及方法在审
申请号: | 201611132104.3 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106844426A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 闵圣捷;丁星;杨春勇;武静;周洋;肖青山;许文英;谢涛;张铭东 | 申请(专利权)人: | 中电科华云信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200231 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 游走 人员 亲密 计算 系统 方法 | ||
技术领域
本发明涉及一种计算系统及方法,特别是涉及一种基于随机游走人员亲密度的计算系统及方法。
背景技术
随机游走模型的基本思想是,从一个或一系列顶点开始遍历一张图,在任意一个顶点,遍历者将以概率1-A游走到这个顶点的邻居顶点,以概率A随机跳跃(teleport)到图中的任何一个顶点,称A为跳转发生概率。每次游走后得出一个概率分布,该概分布刻画了图中每一个顶点被访问到的概率,用这个概率分布作为下一次游走的输入并反复迭代这一过程当,满足一定前提条件时这个概率分布会趋于收敛收敛即可以得到一个稳定的概率分布。在数据挖掘领域,传统的都是利用随机游走模型,构造大量数据,根据随机游走数据分布特征,解决一些多标签分类问题、判断证券价格走势等。然而,这些方法需要构建大量数据,容易造成数据冗余,计算量大,耗时耗材。
发明内容
本发明所要解决的技术问题是提供一种基于随机游走人员亲密度的计算系统及方法,其能够通过对随机游走算法的改进,使该方法执行效率更高,更加节省资源;通过使用最终收敛的转移矩阵作为亲密度的衡量,将人与人之间的关系更加准确。
本发明是通过下述技术方案来解决上述技术问题的:一种基于随机游走人员亲密度的计算系统,其包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。
优选地,所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。
优选地,所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。
优选地,所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。
优选地,所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。
本发明还提供一种基于随机游走人员亲密度的计算方法,其包括以下步骤:
步骤一,抽取、清洗数据,构建包含人物实体与属性实体,以及实体与实体间的语义网络;
步骤二,通过对权重的匹配计算形成多图模型;
步骤三,对整个语义网络使用改进的随机游走算法进行计算;
步骤四,使用最终收敛的转移矩阵作为亲密度的衡量。
本发明的积极进步效果在于:本发明能够通过实体库、属性库、关系库,分布式图形数据库、关系权重自动识别器和关系权重规则器,构建一个大型语义网络;通过人与人之间关系既有直接关系,以及间接关系构建一个亲密度关系矩阵;在矩阵构建成功后,可以使用到不同的应用场景,使查询人际关系更加便捷。
附图说明
图1为本发明的结构示意图。
图2为本发明的流程图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
如图1所示,本发明基于随机游走人员亲密度的计算系统包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中:
语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;
亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。
所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。
所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。
所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。
所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。
如图2所示,本发明基于随机游走人员亲密度的计算方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科华云信息技术有限公司,未经中电科华云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611132104.3/2.html,转载请声明来源钻瓜专利网。