[发明专利]一种互联网用户最大似然地理位置发现方法及发现系统有效
申请号: | 201410762954.6 | 申请日: | 2014-12-11 |
公开(公告)号: | CN104484389A | 公开(公告)日: | 2015-04-01 |
发明(设计)人: | 黄建鹏;陈静 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/12 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210061 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 用户 最大 地理位置 发现 方法 系统 | ||
1.一种互联网用户最大似然地理位置发现方法,其特征在于:首先从网站平台数据源系统中的原始访问日志中按提取规则和提取周期提取基础数据;然后对基础数据进行加工分类形成用户信息和Cookie集相关联的中间层数据;接着对中间层数据进行提取,具体提取规则为:将中间层数据中未登录用户的Cookie集置空,抽取出登录用户的Cookie集,将登录用户的Cookie集关联原始访问日志得到登录用户的所有访问信息集,进而得到将登录用户的IP集,将登录用户的IP集关联IP地址库得到登录用户在访问互联网时的地理位置,将得到的地理位置信息存储到后台服务器中并实时或周期性更新;最后对新用户的访问信息集使用最大似然算法计算出该用户最经常活动的地理位置;其中,基础数据包括一定时长内的非爬虫的访问互联网的时间、用户名、IP和Cookie信息,IP地址库用于存放IP段对应的地理位置信息。
2.根据权利要求1所述的互联网用户最大似然地理位置发现方法,其特征在于:具体包括如下步骤:
(1)从网站平台数据源系统中的原始访问日志中按提取规则和提取周期提取非爬虫的访问日志,该部分访问日志包含用户访问互联网的时间、用户名、IP和Cookie信息;
(2)从步骤(1)获得的部分访问日志中抽取登录用户访问日志,该登录用户访问日志包含用户访问互联网的时间、用户名、IP和Cookie信息;
(3)从步骤(2)得到的登录用户访问日志中提取登录用户的Cookie集;
(4)将登录用户的Cookie集关联原始访问日志得到登录用户的所有访问信息集,该访问信息集包括用户访问互联网的时间、用户名、IP和Cookie;
(5)建立IP地址库用于存放IP段对应的地理位置信息;
(6)生成用户访问地理位置集,具体方法为:将步骤(4)获取的登录用户的所有访问信息集与步骤(5)获得的IP地址库相关联,生成用户访问地理位置集,该用户访问地理位置集包括登录用户访问互联网的时间、用户名、IP和地理位置;将用户访问地理位置集存储到后台服务器中并实时或周期性更新;
(7)基于步骤(6)获得的用户访问地理位置集,建立用户最大似然地理位置算法;
(8)使用步骤(7)得到的用户最大似然地理位置算法对新的用户的访问信息集进行计算,获得该新的用户最经常或最可能的进行生产经营活动的地理位置。
3.一种互联网用户最大似然地理位置发现系统,其特征在于:包括数据信息采集存储模块、数据预处理模块、用户地理最大似然计算模块、IP地址库管理模块和用户最大似然地理结果存储模块,其中:
数据信息采集存储模块,从网站平台数据源系统中提取并存储用户的原始访问日志,从原始访问日志中提取并存储基础数据;
数据预处理模块,从基础数据中提取登录用户的Cookie集,将登录用户的Cookie集关联原始访问日志,提取登录用户的IP集;
IP地址库管理模块,用于存储以及管理从网络采集到的纯真版IP地址库;
用户地理最大似然计算模块,通过登录用户的IP集以及纯真版IP地址库,利用最大似然地理位置算法计算新用户最经常或最可能的进行生产经营活动的地理位置,并对结果进行评估;
用户最大似然地理结果存储模块,用于将新用户的最经常或最可能的进行生产经营活动的地理位置计算结果显示在终端显示器界面。
4.根据权利要求3所述的互联网用户最大似然地理位置发现系统,其特征在于:
数据信息采集存储模块,包括日志文件存储管理子模块和日志文件存储子模块;
数据预处理模块,包括登录用户Cookie集提取子模块和登录用户访问IP集提取子模块;
IP地址库管理模块,用于管理及维护IP段对应国家、省份和城市;
用户地理最大似然计算模块,包括最大似然算法管理子模块、最大似然计算子模块和结果评估子模块;
用户最大似然地理结果存储模块,用于存储用户地理最大似然计算模块的计算结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410762954.6/1.html,转载请声明来源钻瓜专利网。