[发明专利]一种用户兴趣分类方法有效
申请号: | 201911211976.2 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111026960B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 雷鸣 | 申请(专利权)人: | 上海麦克风文化传媒有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 上海九泽律师事务所 31337 | 代理人: | 周云;卢双双 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 兴趣 分类 方法 | ||
本发明公开了数据分类技术领域的种用户兴趣分类方法,使用UCB方法来计算用户的兴趣偏好,是在近实时的情况下进行计算,借助大数据工具Spark Streaming系统+Kafka系统+Hbase系统来搭建整个计算流程,本发明通过UCB算法来构建置信区间曲线,通过实际的反馈不断重新计算UCB的值,以达到动态调整置信区间曲线,使其不断拟合趋近于真实的概率分布曲线,某个类别的UCB的值越大,代表用户更喜欢这个类别,使用UCB方法来计算用户的兴趣偏好,对用户对歌曲的兴趣偏好进行分类,方便根据用户的兴趣进行偏好歌曲的推送,以及服务器数据的更新。
技术领域
本发明涉及数据分类技术领域,具体为一种用户兴趣分类方法。
背景技术
互联网产品上线后,都会面临一个问题,当有新用户来的时候,不可避免会遇到冷启动的问题,新用户的曝光和播放次数相对较少,如何提高新用户的留存率,尽可能的让用户习惯使用自己的产品一直是研究的难点,解决问题的一个方向就是获取用户的兴趣类别,然后有的放矢的为用户进行个性化推荐,这样可以达到事半功倍的效果。
当前互联网产品特别是音频类产品针对新用户的提高留存的方法,一般是尽量推荐产品中现有的比较热门的专辑,一般认为热门的专辑对于新用户具有比较大的吸引力,通过积累一定的用户的点击,播放,购买等行为之后,根据模型计算预测用户的兴趣偏好类别,这种方法导致的结果是预测用户的兴趣类别是比较偏热门的类别,而偏冷门的类别却没有更多的曝光机会,导致预测用户的兴趣出现偏差,基于此,本发明设计了一种用户兴趣分类方法,以解决上述问题。
发明内容
本发明的目的在于提供一种用户兴趣分类方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种用户兴趣分类方法,使用UCB方法来计算用户的兴趣偏好,是在近实时的情况下进行计算,借助大数据工具SparkStreaming系统+Kafka系统+Hbase系统来搭建整个计算流程,整个计算流程步骤如下:
S1:服务器通过Kafka系统将原始数据收据,并通过Kafka系统传输到下游;
S2:通过Spark Streaming系统接收步骤S1中Kafka系统传输下来的数据,并将传输下来的数据解析聚合成计算机语言的数据格式,再通过Kafka系统传输到下游;
S3:下游通过Spark Streaming系统接收步骤S2中Kafka系统传输下来的解析合成数据,首先对传输下来的解析合成数据进行解析,实时统计当前批次用户的各个类别的曝光次数分布、播放次数分布,并且获取当前批次用户在Hbase系统已经存储的各个类别的历史曝光次数分布、历史播放次数分布,代入UCB公式,得到当前批次用户的各个类别UCB的最新值;
S4:将步骤S3中计算后得出的当前批次的用户的最新的各个类别的曝光次数分布、播放次数分布、UCB分值进行分类,同步更新到Hbase系统中,方便服务器根据用户的兴趣进行分类推送。
优选的,所述Kafka系统是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。
优选的,所述Spark Streaming系统对于Spark核心API的拓展,从而支持对于实时数据流的可拓展,高吞吐量和容错性流处理,所述Spark Streaming系统接收到实时数据流同时将其划分为分批,这些数据的分批将会被Spark的引擎所处理从而生成同样按批次形式的最终流。
优选的,所述Spark是专为大规模数据处理而设计的快速通用的计算引擎,所述API是一些预先定义的函数,或指软件系统不同组成部分衔接的约定,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问原码,或理解内部工作机制的细节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦克风文化传媒有限公司,未经上海麦克风文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911211976.2/2.html,转载请声明来源钻瓜专利网。