[发明专利]一种高效的用户兴趣类别预测方法在审
申请号: | 201911212361.1 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111026905A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 雷鸣 | 申请(专利权)人: | 上海麦克风文化传媒有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06F16/182;G06F16/28;G06F16/2455 |
代理公司: | 上海九泽律师事务所 31337 | 代理人: | 周云;卢双双 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 用户 兴趣 类别 预测 方法 | ||
本发明公开了互联网数据分析技术领域的一种高效的用户兴趣类别预测方法,S1:用户数据收集,S2:收集数据整理,S3:整理数据对比,S4:对比数据统计,S5:统计数据推送;本发明通过对用户的数据进行收集以及分析后,根据用户的喜好,进行与其喜好类似的歌曲进行推送,方便用户找到自己喜欢的歌曲,方便用户的使用,以及方便公司了解用户的喜好,而及时的进行原始数据的更新。
技术领域
本发明涉及互联网数据分析技术领域,具体为一种高效的用户兴趣类别预测方法。
背景技术
互联网产品上线后,都会面临一个问题,当有新用户来的时候,不可避免会遇到冷启动的问题,新用户的曝光和播放次数相对较少,如何提高新用户的留存率,尽可能的让用户习惯使用自己的产品一直是研究的难点,解决问题的一个方向就是获取用户的兴趣类别,然后有的放矢的为用户进行个性化推荐,这样可以达到事半功倍的效果。
当前互联网产品特别是音频类产品针对新用户的提高留存的方法,一般是尽量推荐产品中现有的比较热门的专辑,一般认为热门的专辑对于新用户具有比较大的吸引力,通过积累一定的用户的点击,播放,购买等行为之后,根据模型计算预测用户的兴趣偏好类别,这种方法导致的结果是预测用户的兴趣类别是比较偏热门的类别,而偏冷门的类别却没有更多的曝光机会,导致预测用户的兴趣出现偏差。
基于此,本发明设计了一种高效的用户兴趣类别预测方法,以解决上述问题。
发明内容
本发明的目的在于提供一种高效的用户兴趣类别预测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种高效的用户兴趣类别预测方法,
S1:用户数据收集
服务器通过对用户点击查看、播放、下载以及收藏的歌曲数据,收集的数据通过kafka系统传输到下游;
S2:收集数据整理
对步骤S1中通过kafka系统输送的原始数据通过Hdfs系统按照时间的顺序对用户点击查看、播放、下载以及收藏的歌曲数据进行排序,整理好的数据通过kafka系统传输到下游;
S3:整理数据对比
对步骤S2中通过kafka系统输送的整理数据通过Hive系统与服务器中原始数据进行对比,将用户点击查看、播放、下载以及收藏的歌曲数据进行对比分析,且分析的结果数据通过kafka系统传输到下游;
S4:对比数据统计
对步骤S3中通过kafka系统输送的对比数据通过公式
进行用户点击查看、播放、下载以及收藏次数的统计,统计的数据通过
kafka系统传输到下游;
S5:统计数据推送
根据对步骤S4中通过kafka系统输送的统计数据,通过Hdfs系统按照数值从大至小的方式进行排序,并通过Hive系统按照Hdfs系统大至小的方式进行排序将服务器中原始数据与统计数据类似的歌曲数据向用户进行推送。
优选的,所述kafka系统是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。
优选的,所述Hdfs系统放宽了POSIX的要求这样可以实现流的形式访问文件系统中的数据,所述POSIX为可移植操作系统接口。
优选的,所述Hive系统包括数据源、数据存储和管理、数据服务和数据应用。
优选的,所述数据源为数据仓库的数据来源,含外部数据、现有业务系统和文档资料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦克风文化传媒有限公司,未经上海麦克风文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911212361.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种性能参数的确定方法及系统
- 下一篇:三氮唑醇类衍生物及其制备方法和应用