[发明专利]基于时空移动数据表征学习的用户画像推断方法及装置有效
申请号: | 202010328213.2 | 申请日: | 2020-04-23 |
公开(公告)号: | CN111695046B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 徐丰力;李勇;金德鹏 | 申请(专利权)人: | 北京清鹏智能科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06K9/62;G06N20/10 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郭亮 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时空 移动 数据 表征 学习 用户 画像 推断 方法 装置 | ||
本发明实施例提供一种基于时空移动数据表征学习的用户画像推断方法及装置,该方法包括:获取多个用户和用户访问的地点数据,以用户与用户的边长权重表示用户时空模式的相似度,地点与地点的边长权重表示地点功能上的相似度,用户与地点的边长权重表示用户访问地点的频率,得到保留语义的移动网络;获取使预设的目标函数最小时的用户表示向量,输入预设的机器学习分类模型,获取用户画像的推断结果;其中,所述目标函数根据上述三类边长权重,以及用户表示向量和地点表示向量构建得到。该方法无需人为进行大量的特征生成与特征筛选,训练模型的效率较高,有效节约人力成本,且能够有效保障模型性能,进而实现了基于移动数据准确的用户属性推断。
技术领域
本发明涉及用户画像推断领域,尤其涉及一种基于时空移动数据表征学习的用户画像推断方法及装置。
背景技术
用户属性推断(User Demographic Inference)是指基于用户特征数据对用户某一个或几个特定的人口属性(如年龄、性别、教育水平等)进行推断的任务。随着智能移动设备的广泛普及,时空移动数据成为了最为广泛采集的用户特征,其在用户属性推断任务上具有巨大潜力。基于时空移动信息的用户推断的典型应用场景在个性化应用开发中,可以帮助应用开发者针对其用户群体提供更好的个性化服务和设计,如电商平台的个性化商品推荐、出行导航服务的个性化路线推荐等。而在现有的实际生产应用中,用户的时空移动数据存在非结构化、个体差异大等特点,难以直接应用于用户属性推断。
目前使用机器学习算法来完成基于时空移动信息的用户属性推断任务主要将其作为时间序列聚类问题进行分析。常用的方法有分段-分组轨迹聚类算法(Partition-and-Group)和基于时空模式的聚类算法等。然而此类方法只能识别在时空上距离较近的用户(如经常碰面的邻居),无法识别出时空上相距较远但是有相同属性的用户群体(如在不同学校上班的教师),从而其无法实现准确的用户属性推断。同时,在GBDT、XgBoost此类成熟的机器学习算法中,时空移动数据由于其非结构化的特点无法直接作为模型输入,需要人为进行大量的特征生成与特征筛选,训练模型的效率低下、人力成本高昂,且无法有效保障模型性能。
发明内容
为了解决上述问题,本发明实施例提供一种基于时空移动数据表征学习的用户画像推断方法及装置。
第一方面,本发明实施例提供一种基于时空移动数据表征学习的用户画像推断方法,包括:获取多个用户和用户访问的地点数据,以用户与用户的边长权重表示用户时空模式的相似度,地点与地点的边长权重表示地点功能上的相似度,用户与地点的边长权重表示用户访问地点的频率,得到保留语义的移动网络;获取使预设的目标函数最小时的用户表示向量,输入预设的机器学习分类模型,获取用户画像的推断结果;其中,所述目标函数根据上述三类边长权重,以及用户表示向量和地点表示向量构建得到,所述目标函数值为根据表示向量得到的相似度和边长权重的近似程度,所述预设的机器学习分类模型根据带有确定用户类别标签的样本用户表示向量训练后得到。
进一步地,所述获取使预设的目标函数最小时的用户表示向量之前,还包括:根据用户与用户表示向量间相似度,和用户与用户间的归一化边长权重,构建用户-用户边目标函数;根据地点与地点表示向量间相似度,和地点与地点间的归一化边长权重,构建地点-地点边目标函数;根据用户在地点上的相似度,和用户与地点间的归一化边长权重,构建用户-地点边目标函数;根据用户-用户边目标函数、地点-地点边目标函数和用户-地点边目标函数加权求和,得到所述预设的目标函数。
进一步地,所述根据用户与用户表示向量间相似度,和用户与用户间的归一化边长权重,构建用户-用户边目标函数,包括:
其中,Ouu为用户-用户边目标函数;W(ui,uj)为用户-用户边的权值;为用户表示向量间相似度分布;分别为用户ui和用户uj的表示向量;U为所有用户节点,EUU为用户-用户边集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清鹏智能科技有限公司,未经北京清鹏智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010328213.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置