[发明专利]一种互联网用户最大似然地理位置发现方法及发现系统有效
申请号: | 201410762954.6 | 申请日: | 2014-12-11 |
公开(公告)号: | CN104484389A | 公开(公告)日: | 2015-04-01 |
发明(设计)人: | 黄建鹏;陈静 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/12 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210061 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 用户 最大 地理位置 发现 方法 系统 | ||
技术领域
本发明涉及一种互联网用户最大似然地理位置发现方法及发现系统,用于提供互联网用户地理位置的最大似然估计,属于互联网技术。
背景技术
在互联网企业每天都有大量用户点击产生的访问日志数据,专利“一种基于IP地址信息获取计算机精确地理位置信息的方法”(专利申请号:200710070601.X)通过访问日志中的IP和IP地址库匹配,可以即时知道每一条访问行为所在国家、省份和城市地理信息。而专利“一种用于监控网站访客地理位置和访问状态的系统及方法”(专利申请号:200710101333.3)利用实时得到的用户IP地理信息可实时监控并展示网站访客的详细数据信息,也能够有效地定位网站中的异常流量、恶意访问源IP地址的地理位置与INTERNET注册信息。
但是对于互联网企业来讲除了即时用户地理位置外,还希望知道用户中长期所在的主要地理位置,这对于相对稳定的分析用户、了解用户及对用户服务都非常需要。对于用户中长期最可能的地理位置估计(下面我们统一称为用户最大似然地理位置)还面临如下两重挑战:
1、很多互联网允许未登录用户进行访问,造成大量访问日志的用户身份信息为空,为了扩大分析样本数据,我们有必要为这部分数据尽可能确定其用户身份;
2、用户涉及多地理位置访问,我们还需要确定其最大似然地理位置。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种互联网用户最大似然地理位置发现方法及发现系统,解析目前互联网用户中长期访问网络地理位置信息问题。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种互联网用户最大似然地理位置发现方法,首先从网站平台数据源系统中的原始访问日志中按提取规则和提取周期提取基础数据;然后对基础数据进行加工分类形成用户信息和Cookie集相关联的中间层数据;接着对中间层数据进行提取,具体提取规则为:将中间层数据中未登录用户(登录用户名为空)的Cookie集置空,抽取出登录用户(登录用户名不为空)的Cookie集,将登录用户的Cookie集关联原始访问日志得到登录用户的所有访问信息集,进而得到将登录用户的IP集,将登录用户的IP集关联IP地址库得到登录用户在访问互联网时的地理位置,将得到的地理位置信息存储到后台服务器中并实时或周期性更新;最后对新用户(登录用户和未登录用户)的访问信息集使用最大似然算法计算出该用户最经常活动的地理位置;其中,基础数据包括一定时长内的非爬虫的访问互联网的时间、用户名、IP和Cookie信息,IP地址库用于存放IP段对应的地理位置信息。
上述发现方法具体包括如下步骤:
(1)从网站平台数据源系统中的原始访问日志中按提取规则和提取周期提取非爬虫的访问日志,该部分访问日志包含用户访问互联网的时间、用户名、IP和Cookie信息;
(2)从步骤(1)获得的部分访问日志中抽取登录用户访问日志,该登录用户访问日志包含用户访问互联网的时间、用户名、IP和Cookie信息;
(3)从步骤(2)得到的登录用户访问日志中提取登录用户的Cookie集;
(4)将登录用户的Cookie集关联原始访问日志得到登录用户的所有访问信息集,该访问信息集包括用户访问互联网的时间、用户名、IP和Cookie;
(5)建立IP地址库用于存放IP段对应的地理位置信息(国家、省份和城市),IP地址库中的数据按照IP段递增或递减顺序排列并建立代理关键字;
(6)生成用户访问地理位置集,具体方法为:将步骤(4)获取的登录用户的所有访问信息集与步骤(5)获得的IP地址库相关联,生成用户访问地理位置集,该用户访问地理位置集包括登录用户访问互联网的时间、用户名、IP和地理位置;将用户访问地理位置集存储到后台服务器中并实时或周期性更新;
(7)基于步骤(6)获得的用户访问地理位置集,建立用户最大似然地理位置算法;
(8)使用步骤(7)得到的用户最大似然地理位置算法对新的用户(登录用户和未登录用户)的访问信息集进行计算,获得该新的用户最经常或最可能的进行生产经营活动的地理位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410762954.6/2.html,转载请声明来源钻瓜专利网。