[发明专利]一种基于高分散哈希算法的数据采集策略方法及装置有效

专利信息
申请号: 201510492674.2 申请日: 2015-08-12
公开(公告)号: CN105208075B 公开(公告)日: 2018-07-31
发明(设计)人: 吕锐;郭鸿飞;温宇俊;康洁;陈嘉;宋卿 申请(专利权)人: 新华通讯社;中国传媒大学
主分类号: H04L29/08 分类号: H04L29/08;H04L9/06
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100803 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分散 算法 数据 采集 策略 方法 装置
【权利要求书】:

1.一种基于高分散性哈希算法的移动数据采集回传策略方法,该方法基于高分散性哈希算法的移动数据采集回传策略装置实现,该装置包括用户行为采集模块、时间种子生成器、哈希回传时间生成器、时间校正器、定时服务模块、数据传输模块、文件缓存模块、后台接收服务模块;所述数据传输模块由数据加密器组成;

文件缓存模块包括传输计数器、启动计数器、回传时间模块、用户数据缓存模块;

用户行为采集模块与文件缓存模块连接,文件缓存模块与时间校正器、数据传输模块连接;时间种子生成器与哈希回传时间生成器连接;哈希回传时间生成器、时间校正器与定时服务模块连接;定时服务模块与数据传输模块相互交互;数据传输模块与后台接收服务模块连接;哈希回传时间生成器与文件缓存模块连接;

其特征在于:该方法通过如下步骤实现,

(1)通过植入在Android系统中的jar包装置,在Android App内通过用户行为采集模块采集用户行为数据,并把记录的用户数据通过http方式,加密后提交到后台接收服务;

(2)采集用户行为数据利用生命周期事件及主动拦截方式进行采集,并送到App缓存中暂存起来;

(3)Jar植入后,在App第一次启动时,使用时间种子生成器生成设备的唯一标示,然后使用加密器对时间种子生成器生成的唯一标示进行加密处理;同时发起请求通知服务端设备信息,以后将不再通知;

(4)将时间种子生成器生成的唯一标示加密结果使用哈希回传时间生成器进行处理计算,得到一个时间点,该时间点为每天该设备向服务端回传数据的时间点,单位为秒,由植入程序进行管理;

(5)植入程序在得到回传数据的时间点后,启动定时服务模块的定时器在指定时间,读取缓存的用户行为数据,以JSON形式的进行拼接,发动后台服务,使用数据加密器对数据进行加密后回传到服务端,回传成功在计数器中记录成功次数,同时计算出回传成功偏移量;

(6)植入程序会对回传时间生成器生成的时间点进行适度校正,校正的前提是如发现回传数据不能及时处理,将使用时间校正模块,基于回传成功率对该时间点进行重新计算,得到新的回传时间点。

2.根据权利要求1所述的一种基于高分散性哈希算法的移动数据采集回传策略方法,其特征在于:所述步骤(3)中种子生成器采用基于MD5算法实现,从android系统中获取imei+mac地址,两数值以字符串形式拼接后通过MD5算法加密,生成设备标示种子。

3.根据权利要求1所述的一种基于高分散性哈希算法的移动数据采集回传策略方法,其特征在于:所述步骤(4)中,回传时间生成器使用FNV-1算法对种子标示进行计算,首先生成32bit的结果,其中offset_basis和FNV_prime选择中,FNV-1基础偏移量offset_basis选择为2166136261,32bitFNV_prime初始值为16777619,对输入的种子标示的每一个字节,先使用offset_basis乘以FNV_prime得到结果hash,然后将当前标示种子中取来的字节和当前的hash值做异或运算,如此循环,直至标示种子按字节循环完毕得到最后的结果n;将得到的结果R,将结果n对86400取模,86400是通过将24小时转成秒得到结果,结果n对86400取模后,得到一个整型的数N,该数据即为一天中的第N秒。

4.根据权利要求1所述的一种基于高分散性哈希算法的移动数据采集回传策略方法,其特征在于:所述步骤(5)中定时器采用后台服务形式定时运行,将步骤(4)获取到的数据N定义为每天数据回传的时间,发起请求时将JSON数据放在Http数据包的报文中,并使用加密模块的DES对称算法进行加密传输,每天只要传输成功,传输计数器自增长1,初始值为1;每天植入程序记录启动日,启动日计数定义为当日启动次数如大于等于1,,按1记录至启动计数器,初始值为1;一旦成功回传后,将传输计数器与启动计数器恢复初始值。

5.根据权利要求1所述的一种基于高分散性哈希算法的移动数据采集回传策略方法,其特征在于:所述步骤(6)中的时间校正模块,用于将回传时间进行时间重新调配,调配发生时间在App启动时,植入程序发起检测,判断是否需要校正时间,启动条件如下:首先计算成功率,成功率=传输成功次数/启动日数,如果成功率小于50%,启动校正;校正规则如下:第一次,使用86400减去回传时间N即时间翻转得到N1,记入时间校正计数器X;此后每次校正,计算|N1–3600*X|得到校正后时间NX,若NX>86400,对86400取模;目的是提取用户的常连通服务器时间。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华通讯社;中国传媒大学,未经新华通讯社;中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510492674.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top