[发明专利]一种低消耗的Apriori方法有效
申请号: | 201510721082.3 | 申请日: | 2015-10-30 |
公开(公告)号: | CN105224687B | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 郑紫微;金涛 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 邓青玲 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种低消耗的Apriori方法,用于对智能移动终端的移动轨迹的关联移动规则进行挖掘,包括将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,充分考虑移动轨迹的时间和空间双重属性,并且在由候选频繁项集生成频繁项集的过程中,缩小移动轨迹数据集扫描范围,减少获取候选项集的时间,从而达到低消耗的目的。相较于传统Apriori方法,本发明提供的Apriori方法适用于挖掘智能移动终端的移动轨迹关联规则。 | ||
搜索关键词: | 一种 低消耗 apriori 方法 | ||
【主权项】:
1.一种低消耗的Apriori方法,用于对智能移动终端的移动轨迹的关联移动规则进行挖掘,其特征在于:包括如下步骤:步骤一、使用迭代方法挖掘智能移动终端的移动轨迹数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;步骤二、利用步骤一得出的频繁项集,生成智能移动终端所有可能的关联移动规则,并计算每条关联移动规则的置信度,记录智能移动终端每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则;其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:每条关联移动规则的日期加权值TWeight(R)计算公式如下:其中,RuleDate、MaxDate以及MinData分别表示关联移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;n为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;m为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该关联移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;步骤三、根据智能移动终端当前轨迹及步骤二生成的关联移动规则,预测智能移动终端下一个移动轨迹:假定当前智能移动终端的移动轨迹为T:(cn,tn)→(cm,tm),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的关联移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是智能移动终端下一个移动轨迹:Score(R)=Confidence(R)+TWeight(R)其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值;在步骤一中,将智能移动终端的移动轨迹的时间属性与空间属性一同作为挖掘对象数据,用事务数据库D表示智能移动终端的移动轨迹数据集,每条事务条目用移动轨迹记录表示,每条移动轨迹记录则用多个轨迹数据组成,轨迹数据用p1,p2,…pz‑2,pz‑1,pz表示,其中pz={(cz,tz)|cz∈C,tz∈T},代表智能移动终端在时间点tz接入了路由器cz,集合C代表智能移动终端日常经过的所有接入路由器,T代表每天划分的X个时间段集合,X=12或24或48或72;并引入记录ID号来标识每一条智能移动终端的移动轨迹;所述步骤一具体由如下方式实现:(1)、首先遍历整个事务数据库D获得1‑候选项集C1,然后计算1‑候选项集C1中每个候选项的支持度,同时标识出包含该候选项的所有记录ID号,最后删除1‑候选项集C1中支持度小于最小支持度阈值的候选项,就得到了1‑频繁项集L1;(2)、利用1‑频繁项集L1进行内连接运算计算出2‑候选项集C2,计算2‑候选项集C2中每个候选项的支持度是通过将2‑候选项集C2中每个2‑候选项拆分成若干个单独的1‑频繁项;(3)、找出所有(2)拆分出的1‑频繁项中支持度最小的1‑频繁项,同时找出所有包含该1‑频繁项的记录ID号;(4)、遍历(3)中得到的记录ID号的移动轨迹记录来计算每条候选频繁项的支持度,最后删除2‑候选项集C2中支持度小于最小支持度阈值的候选项就得到了2‑频繁项集L2;(5)、3‑频繁项集L3的获取同样是需要将3‑频繁项拆分成若干个单独的1‑频繁项,其余计算过程和2‑频繁项集L2相同,依次类推,算出k‑频繁项集Lk,直到无法再生成频繁项为止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510721082.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于手机APP的本土综合性服务系统
- 下一篇:新词发现方法及装置