[发明专利]含主导特征的co‑location模式挖掘方法在审
申请号: | 201710669858.0 | 申请日: | 2017-08-08 |
公开(公告)号: | CN107480713A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 王丽珍;方圆;王晓璇;陈红梅;周丽华 | 申请(专利权)人: | 云南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 650091 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主导 特征 co location 模式 挖掘 方法 | ||
1.一种含主导特征的co-location模式挖掘方法,其特征在于,按照以下步骤进行:
步骤1,
根据距离阈值生成星型实例集;通过扫描星形关系生成一个k阶co-location候选模式集ck={f1,…,fk};计算参与度;大于参与度阈值的模式即为一个频繁的co-location模式;
步骤2,
对于该频繁模式ck与该模式的k个k-1阶子模式集合分别计算损失度;计算模式的最大特征影响度max_FII(ck)及最小特征影响度min_FII(ck);
步骤3,
通过最大特征影响度与最小特征影响度的差直接判断该模式是否含有主导特征;
步骤4,
根据剪枝策略,利用最大特征差异度计算替代对模式中的每对特征进行两两特征差异度计算;
步骤5,
如果co-location模式ck被检测为含主导特征的co-location模式,则通过计算模式中的每个特征来提取主要特征;计算每个特征的最大特征差异度并判断该特征的最大特征差异度是否大于最小特征差异度阈值min_fd;将大于最小特征差异度阈值min_fd的特征加入模式ck的主导特征集合中;存储含有主导特征的co-location模式;反复执行步骤1-4,逐阶测试生成的co-location模式,直至无法再产生更高阶的频繁模式为止,最后得到了含主导特征的co-location模式集合及其主导特征集合。
2.根据权利要求1所述的含主导特征的co-location模式挖掘方法,其特征在于,所述步骤1按照以下步骤进行:根据距离阈值生成星型实例集,采用基于星型邻居扩展的无连接算法生成,并按照下式计算参与度:
其中,PR(ck,fi)是空间特征fi在k阶co-location模式ck={f1,…,fk}中的参与率,即fi的实例在T(ck)中不重复出现的个数与fi总实例个数的比率,PI(ck)是co-location模式ck的参与度,其为模式ck的所有空间特征的参与率值中的最小值;co-location模式ck的所有行实例的集合称为表实例,记为T(ck);
给定一个空间特征集合F={f1,f2…,fn},一个与F对应的空间实例集合S=S1∪S2∪…∪Sn,其中Si是对应fi的实例集合,一个空间邻近关系R,一个k阶空间co-location模式及一组空间实例的子集若l包含ck的所有特征且所有实例满足{R(ii,ij)|1≤i≤k,1≤j≤k}并形成团,则l称为co-location模式ck中的一个行实例,其中R(ii,ij)的含义指实例ii与ij之间存在邻近关系;空间特征fi在k阶co-location模式ck={f1,…,fk}中的参与率是fi的实例在T(ck)中不重复出现的个数与fi总实例个数的比率,即,其中,π是关系的投影操作,co-location模式ck={f1,…,fk}的参与度PI(ck)是ck的所有空间特征的PR值中的最小值,即给定用户定义的最小参与度阈值min_prev,若PI(ck)≥min_prev,则ck称为频繁的co-location模式,T({fi})的含义是特征fi在空间数据集中的实例个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710669858.0/1.html,转载请声明来源钻瓜专利网。