[发明专利]一种用户标签挖掘方法、装置、服务器及存储介质在审
申请号: | 201910998437.1 | 申请日: | 2019-10-21 |
公开(公告)号: | CN112765448A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 赵呈路;李雪 | 申请(专利权)人: | 北京星选科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 标签 挖掘 方法 装置 服务器 存储 介质 | ||
本发明实施例提供一种用户标签挖掘方法、装置、服务器及存储介质,该方法包括:获取用户的行为日志;根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。本发明实施例可以提升挖掘的用户标签的精度,可应用于相似用户确定,推荐相似用户等场景。
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种用户标签挖掘方法、装置、服务器及存储介质。
背景技术
用户标签是表示用户特性的标签信息,其可以作为用户画像的一部分,常用于用户聚类、信息推荐等场景;用户标签对于精细化用户运营至关重要,因此如何准确挖掘用户标签一直是本领域技术人员的研究热点。
随着在线互联网平台的普及,用户的网上行为越来越多,因此如何利用用户的网上行为,提升挖掘的用户标签的精度,成为了难题。
发明内容
有鉴于此,本发明实施例提供一种用户标签挖掘方法、装置、服务器及存储介质,以提升挖掘的用户标签的精度。
为实现上述目的,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供一种用户标签挖掘方法,包括:
获取用户的行为日志;
根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;
至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;
迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;
以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,所述用户信息为用户向量;所述方法还包括:
根据所述行为日志,确定所述用户的搜索关键词;
所述至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息包括:
基于所述目标对象及所述搜索关键词生成所述用户的用户行为向量;
将所述用户行为向量与所述用户的用户属性向量相拼接,得到所述用户向量。
结合第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,所述用户属性向量包括:由所述用户的基础属性信息生成的基础属性向量,及由所述用户的连续信息生成的非线性向量,所述连续信息至少指示所述用户的用户价值。
结合第一方面的第二种实现方式,本发明实施例在第一方面的第三种实现方式中,所述将所述用户行为向量与所述用户的用户属性向量相拼接,得到所述用户向量包括:
利用机器学习模型的全链接层拼接所述用户行为向量与所述用户属性向量,得到所述用户向量;其中,所述全链接层的非线性激活函数处理所述非线性向量。
结合第一方面,本发明实施例在第一方面的第四种实现方式中,所述迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小包括:
根据所述用户向量与各对象的对象向量,确定所述用户针对各对象的输入向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京星选科技有限公司,未经北京星选科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910998437.1/2.html,转载请声明来源钻瓜专利网。