[发明专利]用户隐性特征计算方法、服务器及计算机可读存储介质在审
申请号: | 201810533606.X | 申请日: | 2018-05-29 |
公开(公告)号: | CN108763478A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 邱孝童 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳协成知识产权代理事务所(普通合伙) 44458 | 代理人: | 章小燕 |
地址: | 518000 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐性特征 计算机可读存储介质 建模 服务器 用户行为数据 个性化推荐 数据支持 行为数据 业务提供 搜索 标签 刻画 分类 | ||
本发明公开了一种用户隐性特征计算方法,该方法包括:获取用户行为数据集;设置所需的用户隐性特征的数量;将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。本发明实施例还公开了一种服务器和计算机可读存储介质。由此,能够精确刻画用户的兴趣标签,从而为搜索、个性化推荐等业务提供数据支持。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种用户隐性特征计算方法、服务器及计算机可读存储介质。
背景技术
随着互联网技术的快速发展,个性化服务越来越成为各个企业关注的重点,互联网个性化技术可以把用户的个性化需求与相关的个性化产品和服务整合起来,从而给用户进行更加精准的个性化推荐、搜索、广告等服务。
互联网个性化服务的形态包括个性化商品推荐、个性化推送、个性化搜索等各个场景,通过相应的个性化技术,为不同的用户提供不同的服务。在各种个性化技术中比较重要的异步就是用户兴趣特征的挖掘和描述,即用户业务画像标签的挖掘。一般的用户业务画像标签的挖掘是通过用户使用的商品标签程度来刻画用户兴趣,但是往往商品标签的总数数量级为万或是数十万,单个用户往往也会达到千的级别。如果用标签总量来标示用户兴趣,则每个用户的兴趣向量维度可达上万维,其中由于与用户发生过交互的商品标签为百级、千级,则每个用户的兴趣向量大部分为0;如果每个用户仅标示最感兴趣的前n(例如n=100)个标签,则会丢失大量用户兴趣信息。
发明内容
本发明的主要目的在于提出一种用户隐性特征计算方法、服务器及计算机可读存储介质,以精确刻画用户的兴趣标签,从而为搜索、个性化推荐等业务提供数据支持。
为实现上述目的,本发明提供的一种用户隐性特征计算方法,所述方法包括步骤:
获取用户行为数据集;
设置所需的用户隐性特征的数量;及
将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。
可选地,所述方法还包括步骤:
利用所述隐性特征进行用户聚类分析。
可选地,所述方法还包括步骤:
将所述隐性特征作为补充特征进行CTR预估。
可选地,所述用户行为数据集中包括一个终端应用的所有用户和所有项目,以及每个用户有过行为的项目列表。
可选地,对所述行为数据集进行LFM建模,得到对应数量的隐性特征的步骤包括:
根据所述数量,将所述行为数据集对应的R矩阵分解为用户特征矩阵P矩阵和项目特征矩阵Q矩阵,所述P矩阵中各项值Pi,j表示用户useri对分类classj的兴趣度,所述Q矩阵中各项值Qi,j表示项目itemj属于分类classi的权重,其中所述分类即为所述隐性特征。
此外,为实现上述目的,本发明还提出一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户隐性特征计算程序,所述用户隐性特征计算程序被所述处理器执行时实现如下步骤:
获取用户行为数据集;
设置所需的用户隐性特征的数量;及
将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。
可选地,所述用户隐性特征计算程序被所述处理器执行时还实现步骤:
利用所述隐性特征进行用户聚类分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810533606.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种短文本分类方法及系统
- 下一篇:基于终端文件系统的文件管理方法