[发明专利]一种语义关联索引方法有效
申请号: | 201310322357.7 | 申请日: | 2013-07-30 |
公开(公告)号: | CN103345536A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 姚瑞波;周凤波;翁强 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 杨晓玲 |
地址: | 210061 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语义关联索引方法,采用虚拟文档技术,解决了语义关联索引的海量性问题和语义关联检索的准确度和召回率问题,达到了对大规模语义关联的有效索引和检索。本发明通过虚拟文档刻画语义关联的独立文本信息和在语义关联图中的图结构信息,并通过迭代不断扩展得到多步全局虚拟文档,使得多步全局虚拟文档在扩展的过程中保持了虚拟文档与网格线语义关联的相关性,避免了盲目扩展造成的检索精度下降,提高了语义关联索引在大规模语义数据上的可行性和效率。 | ||
搜索关键词: | 一种 语义 关联 索引 方法 | ||
【主权项】:
一种语义关联索引方法,其特征在于,该方法包括以下步骤:1)对基于资源描述框架模型的语义关联进行资源描述框架解析,得到语义关联中描述的对象以及对象之间的关系,然后通过分析不同语义关联之间共有的对象,获得无向带标签的语义关联图;2)对所述步骤1)中建立的语义关联图进行赋权,具体方法为:通过计算两个语义关联之间的共有对象个数与总的对象个数的比值,并对比值求对数,得到语义关联图的边的权重,所述边的权重介于0到1之间,表示了两个语义关联之间相关性的强度;3)为每一个语义关联建立一组关键词作为局部虚拟文档,每个局部虚拟文档包含了该语义关联中每个对象描述信息中的关键词,以及对象之间关系描述信息中的关键词;4)对于每个语义关联,将该语义关联在语义关联图中存在直接边的邻居节点的局部虚拟文档,加入到该语义关联自身的局部虚拟文档中,将形成的虚拟文档作为该语义关联的全局虚拟文档;5)获取语义关联与邻居节点之间的直接边的权重w,令S=S×w,如S>K,则将步骤4)中得到的全局虚拟文档作为该语义关联自身的局部虚拟文档后,返回步骤4),否则将步骤4)中得到的全局虚拟文档作为该语义关联最终的多步全局虚拟文档后,进入步骤6),其中S为迭代强度,K为迭代阈值;6)对每个语义关联的多步全局虚拟文档按照文本索引的方式进行索引,并按照信息检索理论中的文本检索模型进行关键词检索,得到匹配关键字查询的语义关联。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310322357.7/,转载请声明来源钻瓜专利网。