[发明专利]含主导特征的co‑location模式挖掘方法在审
申请号: | 201710669858.0 | 申请日: | 2017-08-08 |
公开(公告)号: | CN107480713A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 王丽珍;方圆;王晓璇;陈红梅;周丽华 | 申请(专利权)人: | 云南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 650091 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主导 特征 co location 模式 挖掘 方法 | ||
技术领域
本发明属于空间并置模式挖掘技术领域,特别是涉及一种含主导特征的co-location模式挖掘方法。
背景技术
空间co-location模式(并置模式)挖掘是空间数据挖掘的重要分支,在环境保护,公共交通,定位服务和城市规划等领域有着广泛应用。空间co-location模式是一组在空间中频繁并置的空间特征的子集,例如,{餐厅,超市,咖啡店}是一个普遍的co-location模式,意味着餐厅,超市和咖啡店经常在空间中共同出现。空间co-location模式挖掘一般采用最小参与率(参与度)为度量标准的挖掘框架。将特征的参与率作为空间特征频繁性的度量指标,并使用参与度作为度量空间co-location模式频繁性的指标,通过用户指定的参与度阈值对co-location频繁模式进行挖掘。然而,在某些情况下,用户不仅对一个co-location模式出现在空间中的频繁程度兴趣,而且还关注模式中是否有哪些特征在模式中起主导作用。含有主导特征的co-location模式不仅表明该模式在空间中频繁并置,更重要的是,它表明在同一个co-location模式中的某些特征如何主导其它特征。
确定一个co-location模式是否含有主导特征,并且从co-location模式中提取主导特征具有十分广泛的实际应用。例如:含主导特征的co-location模式挖掘能够帮助植物学家从植物群落中提取优势种。尽管植被数据上的频繁co-location模式挖掘可以发现不同植物间的共存关系,但植物学家仍然需要更多的信息才能够确定频繁并置的植物物种中是否含有优势物种及优势物种的具体种类。含主导特征的co-location模式挖掘的另一个应用是能够帮助用户确定城市规划的主导设施。在城市规划中,通过对城市兴趣点进行含主导特征的co-location城市兴趣点挖掘,能够进一步支持合理的城市规划和业务决策。因此,从频繁co-location模式进一步发现具有主导特征的co-location模式是十分必要的。
在挖掘到的大量频繁co-location模式结果集中,进一步识别含有主导特征的模式,并摘取主导特征,将有效提高挖掘到的频繁co-location模式的可用性,方便用户对挖掘结果的理解和使用具有重要意义。传统co-location挖掘算法采用参与率度量特征在模式中的作用。然而,这样的度量只考虑单个特征的实例参与到模式中的比例,没有考虑到特征之间的影响。为了描述特征之间的相互影响,需要通过频繁模式与其所有直接子模式的参与率变化来分析新特征加入时,该模式中其它特征的影响。
而且现有的参与率-参与度度量无法标识含有主导特征的频繁co-location模式,也无法识别频繁co-location模式中的主导特征。因此,亟需提出含主导特征的空间co-location模式及主导特征的新概念,提出识别含有主导特征的co-location模式及摘取主导特征的新方法。
而识别空间co-location模式的主导特征主要存在两方面的挑战。目前的方法关注寻找模式中特征的频繁并置,忽略了不同特征对模式贡献的差异。因此,如何定义和度量含有主导特征频繁co-location模式及其主导特征是第一个挑战。面对挖掘到的大量co-location模式,如何高效地挖掘含有主导特征的co-location模式及主导特征集是第二个挑战。
发明内容
本发明实施例的目的在于提供一种含主导特征的co-location模式挖掘方法,解决了现有co-location频繁模式挖掘结果数量大、针对性不足的问题,能够有效缩减模式结果。
本发明所采用的技术方案是,一种含主导特征的co-location模式挖掘方法,按照以下步骤进行:
步骤1,
根据距离阈值生成星型实例集;通过扫描星形关系生成一个k阶co-location候选模式集ck={f1,…,fk};计算参与度;大于参与度阈值的模式即为一个频繁的co-location模式;
步骤2,
对于该频繁模式ck与该模式的k个k-1阶子模式集合分别计算损失度;计算模式的最大特征影响度max_FII(ck)及最小特征影响度min_FII(ck);
步骤3,
通过最大特征影响度与最小特征影响度的差直接判断该模式是否含有主导特征;
步骤4,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710669858.0/2.html,转载请声明来源钻瓜专利网。