[发明专利]一种主题地图的评估方法、系统和装置有效
申请号: | 201710792596.7 | 申请日: | 2017-09-05 |
公开(公告)号: | CN107656975B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 聂瑞华;李卓越;赵淦森;王欣明;席云;杨晋吉 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510631 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 主题 地图 评估 方法 系统 装置 | ||
本发明公开了一种主题地图的评估方法、系统和装置,本发明的方法包括以下步骤:用小世界特性对主题地图的文档分类进行验证;用无标度特性对主题地图的重要文档进行验证;对主题地图中主题之间的相关性进行专家验证;系统包括文档分类验证模块、重要文档验证模块和相关性验证模块;装置包括处理器和存储器。本发明的方法利用了小世界特性对文档的分类进行验证以及利用了无标度特性对主题地图的重要文档进行验证,使得进行主题地图的文档分类验证和重要文档验证时,无需人工参与,节省了人力开销。本发明可以广泛应用于数据挖掘领域。
技术领域
本发明涉及数据挖掘领域,尤其是一种主题地图的评估方法、系统和装置。
背景技术
名词解释:
主题地图:是一种语义网络的知识表示模式,一个主题地图包含一系列的topic,每个topic代表一类概念,topic之间使用associations表示关联关系,而topic与资源之间的关联关系使用occurrence表示。
小世界特性:相对于同等规模的随机网络,符合小世界特性的网络具有较高的聚集系数和较短的最短路径长度。
无标度特性:无标度网络拥有很强的异质性,该网络中各节点的度数,即连接状况的分布严重不均匀:网络中少数的节点拥有极大的度(即与其他节点拥有极多的连接),这类节点称为Hub点;其余大多数节点只拥有很少量的连接。无标度网络中为数不多的Hub点对网络的运行有主导作用。广义上讲,无标度网络节点的度分布服从幂律分布。自然界中许多网络都具有无标度的特征,只是幂律指数不同。符合无标度特性的主题地图中,只有很少一部分领域知识与其他领域知识具有较多的语义关联,这部分领域知识可以作为该领域中重要知识的判断依据。
度:顶点所具有的边的数目称为该顶点的度。
网络效率:网络效率描述了从一个节点到另一个节点所需要的平均步数,一个效率低的网络,需要更多的步数才能从一个节点到另一个节点。全局网络效率越高,则说明任意两个节点间的平均最短路径长度就越短。
节点的重要程度:表示该节点被删除后对网络的破坏性,即节点在删除前后的网络效率变化情况。在网络中,如果某个节点被删除,则表示同时删除了与该节点相连的所有连接,对网络造成破坏,从而可能使得网络的效率变差。节点被删去后网络效率变得越差,则表明该节点越重要。
主题地图作为一种重要的指示组织工具,在决策支持和信息导航等方面具有重要作用。一个主题地图是否有效,需要对其进行验证,目前对主题地图的验证方法,主要以人工验证为主,虽然目前采用人工验证的方法可以直接判断主题地图的准确性,但是目前的方法需要对主题地图中的文档的关系进行逐一验证,对于数量庞大的文档,这是一个巨大的工作量,需要耗费大量的人力。
发明内容
为解决上述技术问题,本发明的第一目的在于:提供一种节省人力的主题地图的评估方法。
本发明的第二目的在于:提供一种节省人力的主题地图的评估系统。
本发明的第三目的在于:提供一种节省人力的主题地图的评估装置。
本发明所采用的第一种技术方案是:
一种主题地图的评估方法,包括以下步骤:
用小世界特性对主题地图的文档分类进行验证;
用无标度特性对主题地图的重要文档进行验证;
对主题地图中主题之间的相关性进行专家验证。
进一步,所述用小世界特性对主题地图的文档分类进行验证的步骤包括:通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710792596.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据分析系统
- 下一篇:多媒体数据的播放方法及移动终端