[发明专利]用户性别的确定方法、装置、服务器及存储介质有效
申请号: | 201811030097.5 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109241428B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 方建生 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 510530 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 性别 确定 方法 装置 服务器 存储 介质 | ||
1.一种用户性别的确定方法,其特征在于,包括:
从运营商核心网络侧采集设定时间段内对应于终端用户的历史上网行为数据;
从所述历史上网行为数据中提取所述终端用户对应的应用软件访问数据;
根据所述应用软件访问数据,获得所述终端用户对应的应用软件词项集;
根据所述应用软件词项集中应用软件间的共现关系筛选获得关键应用软件;
获取各所述关键应用软件的性别倾向标签,并基于各所述性别倾向标签确定所述终端用户的性别;
其中,根据所述应用软件访问数据,获得所述终端用户对应的应用软件词项集,包括:
获取所述应用软件访问数据中所包含应用软件数据包对应的生成时间和应用软件;
根据各所述生成时间,确定相应各所述应用软件的用户访问时序及用户访问时长;
根据所述用户访问时序和用户访问时长排列各所述应用软件,形成所述终端用户对应的应用软件词项集,所述用户访问时长用于对应用软件的访问频次进行划分,且所述应用软件在所述应用软件词项集中的记载次数至少为所述访问频次;所述应用软件词项集中应用软件按照访问时序排列;
历史上网行为数据中包括了终端用户访问各应用软件时的访问时间信息、应用软件的名称信息以及应用软件对应的统一资源定位符信息,
所述从历史上网行为数据中提取终端用户对应的应用软件访问数据,包括:
根据应用软件对应的统一资源定位符,从历史上网行为数据中提取用户在设定时间段内的应用软件访问数据;
所述应用软件在所述应用软件词项集中的记载次数的确定包括:
将所述应用软件的用户访问时长与预设的时长阈值进行整除;
将整除结果加1作为所述应用软件所述应用软件词项集中的记载次数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述应用软件词项集中应用软件间的共现关系筛选获得关键应用软件,包括:
根据所述应用软件词项集中应用软件间的共现关系,构建以应用软件为顶点的有向有权关系图,其中,所述应用软件间的共现关系基于所述应用软件词项集中应用软件的排列顺序确定;
根据设定的得分计算公式,确定所述有向有权关系图中各顶点的实际得分值;
将满足筛选条件的实际得分值对应的顶点所代表的应用软件确定为所述终端用户的关键应用软件。
3.根据权利要求2所述的方法,其特征在于,所述根据所述应用软件词项集中应用软件间的共现关系,构建以应用软件为顶点的有向有权关系图,包括:
从所述应用软件词项集中基于所述终端用户访问时序排列的首个应用软件开始,基于设定的共现关系圈定窗口,确定应用软件之间的共现关系;
将所述应用软件词项集中的应用软件作为顶点,在存在共现关系的两顶点间形成有向边,并确定所述有向边的权重值;
基于各顶点及顶点间的有向边构建形成应用软件的有向有权关系图。
4.根据权利要求2所述的方法,其特征在于,所述得分计算公式表示为:
其中,m为大于0的整数,表示得分计算的第m次迭代,d为阻尼系数,WS(m)(Vi)表示顶点Vi在第m次迭代时对应的实际得分值;In(Vi)表示顶点Vi的入边顶点集合;Wji表示顶点Vj指向顶点Vi时对应的权重值;Out(Vj)表示顶点Vj的出边顶点集合;Wjk表示顶点Vj指向顶点Vk时对应的权重值;WS(m-1)(Vj)表示顶点Vj在第m-1次迭代时对应的实际得分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811030097.5/1.html,转载请声明来源钻瓜专利网。