[发明专利]一种高效的用户兴趣类别预测方法在审
申请号: | 201911212361.1 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111026905A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 雷鸣 | 申请(专利权)人: | 上海麦克风文化传媒有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06F16/182;G06F16/28;G06F16/2455 |
代理公司: | 上海九泽律师事务所 31337 | 代理人: | 周云;卢双双 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 用户 兴趣 类别 预测 方法 | ||
1.一种高效的用户兴趣类别预测方法,其特征在于:
S1:用户数据收集
服务器通过对用户点击查看、播放、下载以及收藏的歌曲数据,收集的数据通过kafka系统传输到下游;
S2:收集数据整理
对步骤S1中通过kafka系统输送的原始数据通过Hdfs系统按照时间的顺序对用户点击查看、播放、下载以及收藏的歌曲数据进行排序,整理好的数据通过kafka系统传输到下游;
S3:整理数据对比
对步骤S2中通过kafka系统输送的整理数据通过Hive系统与服务器中原始数据进行对比,将用户点击查看、播放、下载以及收藏的歌曲数据进行对比分析,且分析的结果数据通过kafka系统传输到下游;
S4:对比数据统计
对步骤S3中通过kafka系统输送的对比数据通过公式
进行用户点击查看、播放、下载以及收藏次数的统计,统计的数据通过kafka系统传输到下游;
S5:统计数据推送
根据对步骤S4中通过kafka系统输送的统计数据,通过Hdfs系统按照数值从大至小的方式进行排序,并通过Hive系统按照Hdfs系统大至小的方式进行排序将服务器中原始数据与统计数据类似的歌曲数据向用户进行推送。
2.根据权利要求1所述的一种高效的用户兴趣类别预测方法,其特征在于:所述kafka系统是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。
3.根据权利要求1所述的一种高效的用户兴趣类别预测方法,其特征在于:所述Hdfs系统放宽了POSIX的要求这样可以实现流的形式访问文件系统中的数据,所述POSIX为可移植操作系统接口。
4.根据权利要求1所述的一种高效的用户兴趣类别预测方法,其特征在于:所述Hive系统包括数据源、数据存储和管理、数据服务和数据应用。
5.根据权利要求4所述的一种高效的用户兴趣类别预测方法,其特征在于:所述数据源为数据仓库的数据来源,含外部数据、现有业务系统和文档资料。
6.根据权利要求4所述的一种高效的用户兴趣类别预测方法,其特征在于:所述数据存储和管理为对数据的存储和管理,含数据仓库、数据集市、数据仓库检测、运行与维护工具和元数据管理。
7.根据权利要求4所述的一种高效的用户兴趣类别预测方法,其特征在于:所述数据服务为前端和应用提供数据服务,可直接从数据仓库中获取数据供前端应用使用,也可通过OLAP服务器为前端应用提供负责的数据服务,所述OLAP服务器为联机分析处理,能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。
8.根据权利要求4所述的一种高效的用户兴趣类别预测方法,其特征在于:所述数据应用为直接面向用户,含数据查询工具、自由报表工具、数据分析工具、数据挖掘工具和各类应用系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦克风文化传媒有限公司,未经上海麦克风文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911212361.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种性能参数的确定方法及系统
- 下一篇:三氮唑醇类衍生物及其制备方法和应用