[发明专利]基于移动终端的用户行为相似度识别方法、系统及装置在审
申请号: | 201810307705.6 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108596815A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 贺智谋;洪晶;陈宇 | 申请(专利权)人: | 深圳市和讯华谷信息技术有限公司 |
主分类号: | G06Q50/30 | 分类号: | G06Q50/30;G06Q30/02;H04W4/029 |
代理公司: | 深圳市朝闻专利代理事务所(普通合伙) 44454 | 代理人: | 罗仲辉 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动终端 用户行为 相似度 行为特征 计算机可读存储介质 用户提供数据 用户移动终端 系统及装置 行为相似度 定位目标 关联关系 识别系统 数据分析 行为数据 移动轨迹 用户数据 用户线 多机 刻画 量化 终端 关联 申请 | ||
1.一种基于移动终端的用户行为相似度识别方法,其特征在于,包括:
数据获取步骤,获取至少两部移动终端的指纹信息、所述移动终端的LBS位置信息以及所述移动终端安装的app多维度行为数据信息,所述app多维度行为数据信息包括:app已装卸载行为数据、app卸载行为数据和WiFi连接行为数据;
设备关联步骤,根据所述指纹信息和所述app多维度行为数据信息,对一人多机的移动终端进行关联并生成相应地标记信息;
线上行为相似度计算步骤,根据所述app多维度行为数据提取用户线上行为特征矩阵,根据所述用户线上行为特征矩阵,计算用户之间的线上行为相似度;
线下行为相似度计算步骤,根据所述LBS位置信息,聚合密度较高的报点,得到用户历史轨迹特征矩阵,根据所述用户历史轨迹特征矩阵,计算用户之间的线下行为相似度;
综合分析步骤,根据所述标记信息、线上行为相似度和线下行为相似度,量化用户行为相似度。
2.如权利要求1所述的方法,其特征在于,所述设备关联步骤包括:
根据所述指纹信息和所述app多维度行为数据信息,建立用户指纹信息和app多维行为数据之间的对应关联关系,通过设备指纹和app多维标识的交叉定位分析,确定一人多机备关联度,在关联度高时,对相应地移动终端进行关联并生成相应地标记信息。
3.如权利要求1所述的方法,其特征在于,所述线上行为相似度计算步骤包括计算app安装特征相似度和计算WiFi特征关联度,其中,所述WiFi特征关联度包括工作时段WiFi使用特征关联度和休息时段WiFi使用特征关联度。
4.如权利要求3所述的方法,其特征在于,所述app安装特征相似度使用广义Jaccard相关系数计算,其公式为:
其中,Ci,Cj为设备安装app的特征向量,m表示app的渗透率。
5.如权利要求3所述的方法,其特征在于,所述WiFi特征关联度采用余弦相似度计算,其公式为:
其中,xa、xb分别为用户a、用户b的WiFi使用特征向量,表示用户连接使用某WiFi的强度。
6.如权利要求1所述的方法,其特征在于,所述线下行为相似度计算步骤:
根据用户历史行为特征剔除用户历史LBS信息中的LBS噪声报点,得到优化后的用户报点位置;
对所述优化后的用户报点位置进行聚类分析,得到用户聚合行为轨迹;
将所述用户聚合行为轨迹进行二进制编码,利用所述编码计算所述用户聚合行为轨迹的权重;
根据所述用户聚合行为轨迹的权重,计算两个用户之间任意两条轨迹的海明距离,将所述海明距离归一化处理,得到两条轨迹的相似度;
根据两个用户之间所有轨迹两两之间的海明距离,得到两个用户的聚合行为轨迹相似度。
7.如权利要求6所述的方法,其特征在于,所述用户聚合行为轨迹的权重
其中,表示用户u的第i条轨迹的权重第k的位编码;
其中,
其中,r表示轨迹点,u为用户总数,Tu表示用户u的所有轨迹点的集合,{u:r∈Tu}为轨迹中包含轨迹点r的用户数目;
其中,为轨迹点的权重映射规则;
其中,表示用户u的轨迹i中轨迹点j的第k的位编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市和讯华谷信息技术有限公司,未经深圳市和讯华谷信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810307705.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于人脸识别的社保认证系统
- 下一篇:一种通过互联网购买彩票的信息系统及方法