[发明专利]一种生成用于用户代理信息的数据库的方法在审
申请号: | 201711142442.X | 申请日: | 2017-11-17 |
公开(公告)号: | CN107871008A | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 周英敏;庄福振;敖翔;何清 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 用于 用户 代理 信息 数据库 方法 | ||
技术领域
本发明涉及信息处理,尤其涉及对互联网的用户的信息进行处理。
背景技术
随着互联网大数据分析朝着更加精细、更加人性化的方向发展,越来越多的互联网产品以用户为中心,通过描绘对用户进行“画像”,从而有针对性地提供相应的服务。这里的用户画像最早是由“交互设计之父”Alan Cooper最早提出的概念,即建立在一系列真实数据的基础之上的目标用户模型,属于真实用户的虚拟代表。通过用户画像可以使得互联网产品的设计者在进行产品设计时能够抛开个人喜好,将焦点关注在目标用户的动机和行为上进行产品设计。
在本发明中所考虑的真实数据为用户安装在终端上的APP。根据用户所使用的APP的种类,来判断用户诸如身份、年龄、喜好等特征。例如,若用户使用了“妈妈帮”等APP则说明该名用户很可能是个妈妈,若用户安装了较多的游戏APP则说明该名用户很可能年纪相当年轻、为爱好游戏的青少年。以互联网投放销售产品的广告为例,可以根据用户在终端上所安装的APP,有针对性地为用户推荐产品,例如为妈妈推荐一些婴儿用品,为有爱好者推送一些游戏广告或与游戏相关的产品。
一种最常用的获取终端上所安装APP的方式为通过用户代理(UserAgent,UA)获取涉及APP信息的相关内容,从而判断所实际安装的APP。基于HTTP协议,在用户的终端作为客户端期望获得互联网服务时,需要向服务端提交请求,服务端根据所接收到的请求对客户端做出相应的应答。这里客户端所提交的请求中应当包括UserAgent在内的一系列信息,所述UserAgent为一个只读的字符串,其声明了浏览器用于HTTP请求的用户代理头的值。通过获取客户端向服务端的请求信息,可以获得UserAgent。图1示出了一个标准的UserAgent格式,其中在UserAgent中Rendering engine/[version]指的是各大浏览器的内核,即渲染引擎相关信息以及版本,[system and browser information]指的是浏览器正在使用的系统详细信息,platform指的是浏览器平台的详细信息,extensions指的是第三方使用的特定增强功能,在这个字段中一般会涉及与APP的相关信息。UserAgent经常被用于识别产生请求的客户端的相关信息,使得服务器能够识别客户使用主机的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件以及APP名称等。利用识别出来的信息,可以分析用户的手机品牌,APP使用习惯等,从而有效地构建用户画像。
大部分品牌的手机和平板等通讯和娱乐设备所安装的APP访问所产生的UserAgent格式都符合此规范,但还有小部分厂商生产的通讯和娱乐设备所安装的APP访问产生UserAgent并不符合此规范。图2示出了一个满足图1所示出格式的标准UserAgent的示例,并且图3示出了一个不满足图1所示出格式的UserAgent。可以看到,在图2所示出的标准UserAgent中可以清楚地区分出Mozilla/5.0,其表述与Mozilla引擎的兼容性,Windows NT 6.1;WOW64为浏览器正在运行的系统的详细信息,AppleWebKit/537.1为浏览器使用的平台,KHTML,like Gecko为浏览器平台的详细信息,Chrome/22.0.1207.1Safari/537.1是第三方中使用的特定增强功能,在本条UserAgent中指的是Chrome浏览器。相对地,图3中的%E5%A4%A9%E6%B0%94%E9%80%9A/5.159.335372指的是天气通,在本条UserAgent中指的是app的名称以及版本,CFNetwork/808.0.2是浏览器使用的系统,Darwin/16.0.0是浏览器平台,而这些信息并不能仅通过将该UserAgent与标准UserAgent的格式进行简单的比较而获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711142442.X/2.html,转载请声明来源钻瓜专利网。