[发明专利]基于MapReduce的LBS兴趣点发现方法有效
申请号: | 201410037999.7 | 申请日: | 2014-01-26 |
公开(公告)号: | CN103729478B | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 胡峰;向倞;于洪;娄华宾 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 重庆华科专利事务所 50123 | 代理人: | 康海燕 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于MapReduce的LBS兴趣点发现方法,涉及计算机信息处理技术。使用MapReduce进行数据变换,得到项集频率降序序列,对事务集按照项集分组降序序列进行分发,在各机器上建立FP‑Tree进行挖掘,对增量数据进行变换,对事务集按照增量数据分组进行划分,并行挖掘增量数据。本发明在MapReduce的PFP算法基础上,对增量数据筛选处理,处理部分增量数据,得到所有频繁项集,而不是每次重新挖掘全局数据,建立兴趣点关联规则数据挖掘模型,利用分布式并行化技术提高了关联规则挖掘算法的运行速度,能有效挖掘强关联性的兴趣点数据。 | ||
搜索关键词: | 基于 mapreduce lbs 兴趣 发现 方法 | ||
【主权项】:
使用基于MapReduce的LBS兴趣点发现方法,其特征在于,包括步骤:从系统处获取用户群位置记录数据文本文件,由Hadoop自动进行分布式存储,再对用户群位置记录数据文本文件使用MapReduce进行数据变换,得到用户群位置坐标事务集文本文件;获取用户群位置坐标事务集文本数据文件,计算事务集文本数据文件中每个项的频度并按降序排列,得到项集频度降序序列文本文件,对项集频度降序序列文本文件中频率字段值进行分组,得到项集频度分组降序序列文本文件;对用户群位置坐标事务集文本文件按照项集频度分组降序序列进行分组,得到用户群位置坐标分组文件,对用户群位置坐标分组文件中的每个分组建立频繁模式树FP‑tree,根据FP‑Tree得到用户兴趣坐标分组频繁项集文本文件,以及聚合分组数据后的兴趣坐标频繁项集文本文件;从系统处获取用户群位置记录增量数据文本文件,由Hadoop框架自动进行分布式存储,进行数据变换,获得用户群位置坐标增量事务集文本文件,计算增量事务集中每个项的频率并按降序排列,得到增量项集频率降序序列;将增量事务集的频率降序序列与增量前项集频率降序序列文本文件进行合并,得出全局项集频率降序序列;对上述全局项集频率降序序列进行分组,标记出需要重新挖掘的增量数据分组,对用户群位置坐标增量事务集文本文件进行分组,得到增量用户群坐标事务分组文本文件,对增量用户群坐标事务分组文本文件中的每个分组建立FP‑Tree,进行并行挖掘,得到增量用户兴趣坐标分组频繁项集;将增量用户兴趣坐标分组频繁项集与用户兴趣坐标分组频繁项集合并,得到全局频繁项集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410037999.7/,转载请声明来源钻瓜专利网。