[发明专利]获取用户画像的方法及装置在审
申请号: | 201610284124.6 | 申请日: | 2016-04-29 |
公开(公告)号: | CN107341679A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 鲁梦平 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 刘映东 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 用户 画像 方法 装置 | ||
技术领域
本发明实施例涉及信息处理技术领域,特别涉及一种获取用户画像的方法及装置。
背景技术
用户画像,又称用户角色(Persona),是一种用于勾画目标用户、联系用户诉求与设计方向的有效工具,其在各领域得到了广泛的应用。具体实现时,可将用户画像以用于刻画用户特征的标签(tag)集合表示,该标签集合可包括从用户社会属性、生活习惯、消费行为等角度刻画用户特征的标签。比如年龄、性别、地域、学历和用户偏好等标签。
现有技术提供了一种获取用户画像的方法。预先设定多个标签,并人工为每一个标签设定相应的标签权重,标签权重可以根据实际应用的需求或人工经验预先设定。可选的,对于每一个标签,根据具备该标签的物品在所有物品中的占比,设定该标签对应的标签权重。通常,上述占比与标签权重呈负相关关系,也即上述占比越大则标签权重越小,上述占比越小则标签权重越大。而后获取用户行为日志,用户行为日志记录有用户对各个物品执行的各种行为,比如:用户1浏览了物品1、用户2购买了物品1、用户1购买了物品2等。然后根据各个物品所具备的标签和用户对各个物品执行的行为,确定用户对各个标签的行为权重。最后分别根据每一个标签对应的标签权重和行为权重,计算得到用户对该标签的喜好程度,整合用户对各个标签的喜好程度得到用户画像。例如,用户对某一标签的喜好程度,可采用该标签对应的标签权重与行为权重的乘积表示。
然而,在现有技术中,由于需要人工为每一个标签设定相应的标签权重,而标签的数量往往较多,这就导致需要花费大量的时间和人力资源,获取用户画像所耗费的时间和人力成本较高;并且,由于人工设定标签权重的方式难免存在误差,很难保证人工设定的标签权重与实际业务相符,导致最终获取的用 户画像的准确度较低。
发明内容
为了解决现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题,本发明实施例提供了一种获取用户画像的方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供了一种获取用户画像的方法,所述方法包括:
根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,所述M为正整数;
根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,所述m表示用户个数,所述k表示因子个数,所述n表示标签个数,所述m为正整数,所述k为正整数,所述n为大于1的整数;
根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,所述用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,所述u为大于等于1且小于等于m的整数,所述t为大于等于1且小于等于n的整数。
根据本发明实施例的第二方面,提供了一种获取用户画像的装置,所述装置包括:
样本获取模块,用于根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,所述M为正整数;
矩阵修正模块,用于根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,所述m表示用户个数,所述k表示因子个数,所述n表示标签个数,所述m为正整数,所述k为正整数,所述n为大于1的整数;
画像获取模块,用于根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,所述用户画像矩阵Pm×n中第u 行第t列的元素Put表示用户u对标签t的喜好程度,所述u为大于等于1且小于等于m的整数,所述t为大于等于1且小于等于n的整数。
本发明实施例提供的技术方案带来的有益效果包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610284124.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于大数据分析的精准营销返利平台
- 下一篇:一种社区车位共享方法及其服务器