[发明专利]一种面向多实体稀疏关系的联合挖掘方法在审
申请号: | 201510175590.6 | 申请日: | 2015-04-14 |
公开(公告)号: | CN104915371A | 公开(公告)日: | 2015-09-16 |
发明(设计)人: | 杨武;申国伟;王巍;苘大鹏;玄世昌 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于智能信息处理领域,具体涉及一种利用计算机技术辅助网络信息智能分析和处理的面向多实体稀疏关系的联合挖掘方法。本发明包括:从异构数据中抽取实体、异质关系,两类实体之间的异质关系采用异质关系矩阵表示,进而构建异质关系矩阵集合R;对于每一个异质关系矩阵Ri进行非负矩阵分解;针对每一类实体对应的矩阵分解结果进行融合,得到最终的聚类指示矩阵。本发明在真实数据集上与最近的几种方法进行了对比分析,可知本方法在准确率、纯度、NMI和ARI四个度量指标下都整体优于其他算法。本方法只与规模较小一类的实体相关,因此在大规模数据上具有较好的可扩展性。 | ||
搜索关键词: | 一种 面向 实体 稀疏 关系 联合 挖掘 方法 | ||
【主权项】:
一种面向多实体稀疏关系的联合挖掘方法,其特征在于,包括以下步骤:(1)从异构数据中抽取实体、异质关系,两类实体之间的异质关系采用异质关系矩阵表示,进而构建异质关系矩阵集合R:(1.1)实体抽取:从异构数据中抽取待分析的实体,并统计实体在异构数据中的出现频次,剔除频次小于或等于2次的实体,选择剩余的实体作为待分析实体集合;(1.2)异构关系抽取:从待分析的实体集合中抽取任意两个实体之间存在的异质交互关系;(1.3)异质关系形式化建模:任意两类实体之间的异质关系通过二部图进行建模,两个实体之间交互的频次作为异质关系的强度,二部图进一步可通过异质关系矩阵进行表示;(2)对于每一个异质关系矩阵Ri进行非负矩阵分解:(2.1)关联矩阵构造:从异质关系矩阵中选择规模较小一类实体,依据同类实体之间的关联关系构建关联矩阵;(2.2)基于稀疏约束的关联矩阵稀疏对称分解:针对关联矩阵,采用鲁棒的稀疏约束的对称分解方法;(2.3)异质关系矩阵三分解:以关联矩阵分解得到的结果作为输入,采用迭代的三分解方法进行求解;(3)针对每一类实体对应的矩阵分解结果进行融合,得到最终的聚类指示矩阵:(3.1)聚类指示矩阵二元化:根据关联矩阵对称分解的结果进行二元化;(3.2)针对每一类实体对应的聚类指示矩阵进行融合,得到最终的聚类指示矩阵,分解得到的指示矩阵中只有一个元素为1,其余为0,指示矩阵中为1的表示实体属于对应的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510175590.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种快速冷却的电压力锅
- 下一篇:锅具及烹饪器具