[发明专利]一种图结构相似度测量方法及其系统无效
申请号: | 200810102711.4 | 申请日: | 2008-03-25 |
公开(公告)号: | CN101256594A | 公开(公告)日: | 2008-09-03 |
发明(设计)人: | 李青;王莉萍;刘文印;杨宇;李娜 | 申请(专利权)人: | 北京百问百答网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 | 代理人: | 梁挥;祁建国 |
地址: | 100872北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结构 相似 测量方法 及其 系统 | ||
技术领域
本发明涉及结构相似度测量技术,特别是涉及一种可用于数据挖掘或信息检索领域中图结构相似度测量方法及其系统。
背景技术
随着互联网的飞速发展,信息技术的发展也突飞猛进,各类信息资源的数量以惊人的速度增长,如何在浩瀚的信息海洋中快速而又准确地检索出自己所需要的信息成为信息检索技术亟待解决的一大难题。
相似度测量算法可用于数据挖掘或信息检索领域中。如文本相似性度量,很多文本应用包括文档聚类、文档检索、文档过滤等,都依赖于文档相似性的精确度量。然而现有的信息检索技术所采用的文本相似度度量并不能较好地进行信息检索,信息检索的性能不强,准确度不高。
发明内容
本发明所要解决的技术问题在于提供一种图结构相似度测量方法及其系统,用于在数据挖掘或信息检索中通过将信息转化为图并通过图结构计算相似度,以提高信息检索能力和准确度。
为了实现上述目的,本发明提供了一种图结构相似度测量方法,其特征在于,包括:
步骤一,输入第一个图、第二个图,并获取所述第一个图的SG空间、所述第二个图的SG空间;
步骤二,根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。
所述的图结构相似度测量方法,其中,所述步骤一中,所述SG空间由所述第一个图或所述第二个图所包含的SG组成,所述SG为从所述第一个图或所述第二个图中抽取的一个关系,表示为<X,v1,v2>,v1和v2分别是所述第一个图或所述第二个图中2个不同的顶点,X表示v1,v2的关系,X为前驱模式或后继模式或前向边模式,前驱模式表示在所述第一个图或所述第二个图中存在分别从v1,v2指向一相同节点的边;后继模式表示在所述第一个图或所述第二个图中存在从一相同节点分别指向v1,v2节点的边;前向边模式表示在所述第一个图或所述第二个图中存在v1指向v2的边。
所述的图结构相似度测量方法,其中,所述步骤二中,所述结构相似度为以所述第一个图、所述第二个图之间的SG距离与重合百分比表示的函数。
所述的图结构相似度测量方法,其中,所述SG距离的计算公式如下:
G1:所述第一个图;
G2:所述第二个图;
SGDist(G1,G2):G1和G2的SG距离;
C11:G1中SG的数目;
SGi:SG空间中第i个SG;
r1、r2:SGi分别在G1和G2中的数目。
所述的图结构相似度测量方法,其中,所述重合百分比的计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百问百答网络技术有限公司,未经北京百问百答网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810102711.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速加载内嵌媒体数据的方法及系统
- 下一篇:超高层组合墙双重结构体系