[发明专利]基于互联网的用户数据采集方法有效

专利信息
申请号: 201110393822.7 申请日: 2011-12-02
公开(公告)号: CN102521760A 公开(公告)日: 2012-06-27
发明(设计)人: 郑斌;韩啸 申请(专利权)人: 互动通天图信息技术有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06F17/30
代理公司: 上海宝鼎专利代理有限公司 31222 代理人: 龚峥嵘
地址: 201203 上海市浦东新区张江高科技园*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 互联网 用户 数据 采集 方法
【说明书】:

技术领域

发明涉及一种网络用户数据采集方法,尤其涉及一种基于互联网的用户数据采集方法。 

背景技术

互联网广告随着时间和技术的发展,已经进入精准广告时代,精准定向是基于互联网技术采集到的用户和投放网站内容等相关信息,通过精准算法匹配出来的广告投放的技术策略。简单来说,让互联网的用户在不同网站看到他感兴趣的广告。实现精准广告技术前提首先获得用户数据,通过数据模型比较分析出用户的行为属性,从统计学角度来说,用户数据越多,对用户属性的分析准确性越高。为了获得海量数据中,提高广告覆盖面,最理想的情况是通过跟众多互联网门户,媒体,社区等的合作,收集足够的用户数据;但实际的情况是互联网广告服务提供商,未必能跟所有的媒体和网站达成合作,因此收集用户的全面的互联网访问行为成为广告服务提供商的重大阻碍。 

Cookie是互联网媒体跟踪记录用户访问信息的重要技术手段,用户访问网站的时候,网站就可以在用户客户端留下一些数据,从而根据这些记录数据,对于用户登录,访问次数等进行比对。请参见图1,现有的基于cookie的用户数据采集及用户行为跟踪过程如下: 

步骤S101:网络广告服务商提供一段脚本代码,加挂在合作媒体网站;

步骤S102:用户访问合作媒体加挂该脚本代码的网页时,脚本代码会在用户客户端种下一个cookie,用于识别和记录用户和用户行为;

步骤S103:脚本代码检查用户客户端cookie信息;

步骤S104:脚本代码更新用户客户端cookie信息;

步骤S105:脚本代码同时将基于cookie的用户行为发送给服务器端。

现有的基于互联网的用户数据采集用cookie来识别用户,获得统一标识符,基于cookie为标识的用户行为进行分析,从而实现用户兴趣行为的分析和投放。但是Cookie技术具有明显的技术缺陷:a)    用户访问没有加挂自有脚本代码的网页行为不会被检查得到b) 出于对用户访问隐私的保护,客户端Cookie是收到严格的权限保护的,即单个网站种下的cookie只能被该网站访问;c) Cookie是可被第三方软件限定或清除的,目前360安全卫士,QQ 电脑管家等第三方软件都提供这样的功能,用户本地的Cookie会被强制或定时清除,从而失去对用户定向的数据来源。 

因此,比较理想的情况是用户访问的不同网站,都能拿到用户的访问数据,则为用户行为分析提供充足的数据。但是如何获得目标用户最新的网站访问列表的技术问题一直互联网领域的通用技术难题。 

发明内容

本发明所要解决的技术问题是提供一种基于互联网的用户数据采集方法,能够获取用户最新的访问网页列表,解决之前基于cookie进行追踪的缺陷;以及没有加挂网络广告服务商脚本代码页面没法追踪的问题。 

本发明为解决上述技术问题而采用的技术方案是提供一种基于互联网的用户数据采集方法,包括如下步骤:a) 在合作媒体页面加挂广告服务提供商的脚本代码,并在服务器端预先存储常用的网页地址;b) 用户访问合作媒体页面时激活该脚本代码;c) 该脚本代码从服务器端下载常用的网页地址列表;d) 该脚本代码比对用户本地网页地址列表和下载下来的常用网页地址列表,获得该用户访问过的网址列表;e) 该脚本代码将该用户访问过的网址列表传回给服务器端。 

上述的基于互联网的用户数据采集方法,其中,步骤d) 通过iframe下的链接标签比对,通过该条记录在浏览器中默认颜色的改变,来获得用户访问过的网址列表。 

上述的基于互联网的用户数据采集方法,其中,所述服务器端常用网页地址列表分成若干组,每次用户请求访问合作媒体页面时,该脚本代码只从服务器端取出一组网页地址列表和用户本地网页地址列表进行比对;下一次请求时更换到下一组网页地址列表,直到全部网页地址列表都比对完毕。 

上述的基于互联网的用户数据采集方法,其中,所述服务器端常用网页地址列表分成50-100组,每组网页地址列表包括50-1000个网址。 

本发明对比现有技术有如下的有益效果:本发明提供的基于互联网的用户数据采集方法,通过比对用户本地电脑或终端的浏览器历史网站地址列表和服务器端网站地址列表获得用户最新访问网站列表的信息,从而解决之前cookie删除以及没有加挂脚本代码的网页访问行为没法得到追踪的问题。进而判断出用户的行为特征,并基于用户行为特征,实现广告精准投放。 

附图说明

图1为现有基于互联网的用户数据采集流程图; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于互动通天图信息技术有限公司,未经互动通天图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110393822.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top