[发明专利]一种基于知识的多层次同位模式挖掘方法在审
申请号: | 202111208564.0 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113987012A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 包旭光;王龙;常亮;古天龙 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/29;G06F16/901 |
代理公司: | 桂林文必达专利代理事务所(特殊普通合伙) 45134 | 代理人: | 白洪 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 多层次 同位 模式 挖掘 方法 | ||
本发明公开了一种基于知识的多层次同位模式挖掘方法,首先结合本体表示的领域知识与空间数据获取所述空间数据的语义关系,再依据距离阈值获取空间数据集的星型邻居关系,根据星型邻居获取团实例,通过团实例发现同位模式的方法,既避免了生成表实例的大量连接操作,也缓解了发现极大团的困难,解决了现有技术中的同位模式发现方法在生成表实例时需要大量的连接操作且难以发现极大团的技术问题,同时缓解了现有同位模式挖掘方法只能发现细粒度特征的单层次的同位模式的局限性。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于知识的多层次同位模式挖掘方法。
背景技术
空间同位模式挖掘是空间关联分析的一个重要分支,通过空间同位模式挖掘方法得到的同位模式可以服务于各个领域,包括生态和环境管理、城市服务、商业服务等。空间同位模式挖掘旨在发现实例在空间中经常邻近的出现特征的集合。
作为数据挖掘的一个分支,空间数据挖掘与事务数据挖掘密切相关。Apriori算法的提出是数据挖掘历史上的一个里程碑。之后,许多类似Apriori的发现同位模式的有趣方法被陆续提出。这些方法通过低阶的同位模式的相互连接生成高阶的同位模式,由于空间数据挖掘的特殊性,连接过程不仅包含模式之间的连接,而且生成表实例也需要大量连接操作。为了避免在发现同位模式时的大量连接操作,一些研究者提出了在空间数据中获取极大团,然后通过过滤极大团发现同位模式的方法。极大团使用,可以有效避免通过连接生成表实例的繁琐,然而在图中找到极大团是一个NP-hard问题。
发明内容
本发明的目的在于提供一种基于知识的多层次同位模式挖掘方法,旨在解决现有技术中的同位模式发现方法在生成表实例时需要大量的连接操作且难以发现极大团的技术问题,以及缓解现有同位模式挖掘方法只能发现细粒度特征的单层次的同位模式的局限性。
为实现上述目的,本发明提供了一种基于知识的多层次同位模式挖掘方法,包括下列步骤:
结合本体表示的领域知识与空间数据,获取所述空间数据的语义关系;
依据距离阈值获取空间数据集的星型邻居关系;
根据星型邻居获取团实例;
根据获取的团实例获取哈希结构;
根据所述语义关系更新所述哈希结构;
过滤并获取多层次的同位模式。
其中,所述空间数据的语义关系的表现形式是一个多层次的语义结构,包括实例层、特征层和概念层,所述实例层和所述特征层只有一层,所述概念层有多层。
传统的同位模式挖掘只是发现由特征层中的特征组成的同位模式,这会导致数量较多且难以反映特征本质,从概念层进行描述更能反映本质。
其中,所述空间数据集由分布在特定空间内的实例及其位置构成,当两个实例距离小于所述距离阈值时被认定为邻居关系。
其中,在依据距离阈值获取空间数据集的星型邻居关系的过程中,所述星型邻居只能是特征类型不小于自己的特征类型的实例。
其中,在根据星型邻居获取团实例的过程中,以单个实例为开始,将所有邻居加入图数据结构中作为后继节点,然后对于每一个叶子节点,对星型邻居中特征类型比它的特征类型大的实例取交集,将得到的交集加入图中作为此节点的后继节点,重复直到所有节点指向None,获取所述团实例。
为了产生完备且正确的团实例,需要采取一种类似AOE网的图数据结构。
其中,所述哈希结构由键值对组成,键是某个团实例的一组特征类型,值是键值对的列表,是键对应的在团中的特征的一组实例。
为了发现候选同位模式,使用所述哈希结构存储团实例,并通过所述团实例中的特征类型更新所述哈希结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111208564.0/2.html,转载请声明来源钻瓜专利网。