[发明专利]一种基于多场景多数据源校验的大数据扩样方法有效
申请号: | 201810491730.4 | 申请日: | 2018-05-21 |
公开(公告)号: | CN108733818B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 刘杰;顾高翔;张颖;吴佳玲;郭鹏;宫龙 | 申请(专利权)人: | 上海世脉信息科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/2458;G06F16/23 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 200040 上海市静安区沪太支路536,5*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多场景多数据源校验的大数据扩样方法,本发明对于移动终端大数据进行处理和筛选,由个体所持移动终端和固定传感器之间的通信记录构建出个体出行的时空序列数据集;根据不同的场景类型设计判别规则判别在指定时间段内进出指定场景的个体及其出入次数;获得由第三方仪器测定的指定时间内在指定场景的总人数,将由从个体所持移动终端和固定传感器之间的通信记录挖掘出的个体出入指定场景频次数总和与其对比;不断将新的产生的个体所持移动终端和固定传感器之间的通信记录与第三方仪器监测数据导入分析,采用跨期衰减的方法使用新的扩样参数部分替代旧的扩样参数,实现扩样参数的实时更新。 | ||
搜索关键词: | 一种 基于 场景 多数 校验 数据 方法 | ||
【主权项】:
1.一种基于多场景多数据源校验的大数据扩样方法,其特征在于,包括以下步骤:步骤1、从传感器运营商处获取一定时间范围内的匿名加密移动终端传感器数据,为每个用户构建由个体和固定传感器通信记录构成的初步的个体出行时空轨迹,将固定传感器的地理属性赋予个体出行时空轨迹中的每个通信节点,以此构建个体出行时空数据集;步骤2、指定待分析的时间段PERIOD和待分析的场景FACI,在场景FACI内布置有第三方仪器,依据个体进出场景FACI时是否需要通过第三方仪器与场景FACI内部的固定传感器进行通信,将场景FACI内部的固定传感器分为两组,其中,个体进出场景FACI时不需要通过第三方仪器就可与分组GROUP1内的固定传感器进行通信,个体进出场景FACI时需要通过第三方仪器才能与分组GROUP2内的固定传感器进行通信;步骤3、遍历所有个体出行时空数据集,筛选出在时间段PERIOD内与分组GROUP2内的固定传感器发生过通信行为的个体,在筛选出的每个个体的个体出行时空数据集为与GROUP1内的固定传感器及GROUP2内的固定传感器发生过通信行为的通信节点做标注,标注时利用GROUP1内的固定传感器及GROUP2内的固定传感器的编号,随后再次遍历所有个体出行时空数据集,将时间上连续且标注有相同固定传感器的编号的通信节点合并;步骤4、对合并后的通信节点,根据已标注的通信节点前后的通信节点是否有与GROUP1内的固定传感器发生通信行为的记录,判断当前个体出行时空数据集所对应的个体是否出入当前场景FACI;步骤5、根据步骤4得到的结果,统计所有个体在时间段PERIOD内在场景FACI内出现的次数,从而在时间段PERIOD内出现在场景FACI内的总人数就是乘上单个个体出现频次的样本数量总和;步骤6、整理来源于第三方仪器的数据,利用第三方数据统计时间段PERIOD内场景FACI的总客流量;步骤7、将步骤6得到的总客流量与步骤5得到的总人数进行比较,得到时间段PERIOD内在场景FACI的个体出现数据扩样比;步骤8、采用步骤2至步骤7相同的方法,得到相同时间段PERIOD内不同场景的个体出现数据扩样比,采用总客流量加权的方法获得包含所有场景的目标区域的个体出行样本数据扩样参数;步骤9、实时更新各个对应时间段个体出行样本数据集和通过第三方仪器获得的第三方统计数据,利用步骤2至步骤7的方法对各级别的个体出现数据扩样比进行更新,同时挖掘个体出现数据扩样比随时间的变化趋势。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海世脉信息科技有限公司,未经上海世脉信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810491730.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种材料管理的系统和方法
- 下一篇:一种人员档案建立方法和装置