[发明专利]一种基于用户浏览轨迹推的大数据建模系统在审

专利信息
申请号: 201911285236.3 申请日: 2019-12-13
公开(公告)号: CN111026745A 公开(公告)日: 2020-04-17
发明(设计)人: 陆洋 申请(专利权)人: 江苏三六五网络股份有限公司
主分类号: G06F16/215 分类号: G06F16/215;G06F16/25;G06F16/9535;G06F16/9536;G06K9/62
代理公司: 南京常青藤知识产权代理有限公司 32286 代理人: 毛洪梅
地址: 210000 江苏省南京市新*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 用户 浏览 轨迹 数据 建模 系统
【权利要求书】:

1.一种基于用户浏览轨迹推的大数据建模系统,其特征在于,包括:

应用层,将各业务系统通过各终端基于BI实时上报用户行为作为维度数据,并将维度数据存储于mysql、oracle、mongodb数据库中;

数据层,将各业务系统的维度数据通过Kafka作为统一采集平台的消息管理层,采集汇总到总数据仓库oracle中;

清洗过滤层,将总数据仓库oracle中的数据进行清洗、沉淀、标注、归类、纠错来重新规范化数据源,并进行全新定义、颗粒化、索引;

AI数据中台,提供底层的服务架构,将清洗过滤层处理后的数据进行数据建模分析,为服务层提供底层维度数据;

服务层,为各业务系统提供维度数据作为业务支撑。

2.根据权利要求1所述的一种基于用户浏览轨迹推的大数据建模系统,其特征在于,所述清洗过滤层先通过python处理总数据仓库oracle中部分异常数据源,再采用Hive作为数据清洗引擎,将用户行为及上下文模型数据进行推理,进行数据预处理、加工、整合。

3.根据权利要求1所述的一种基于用户浏览轨迹推的大数据建模系统,其特征在于,所述AI数据中台中所述数据分析包括数据预处理和数据建模分析,所述数据预处理是从海量数据中提取可用特征,用Impala做数据预处理;所述数据建模分析是针对数据预处理提取的特征,用的机器学习算法包括决策树、协同过滤。

4.根据权利要求1所述的一种基于用户浏览轨迹推的大数据建模系统,其特征在于,所述AI数据中台通过多个服务器搭建Hadoop集群,Hadoop集群的框架核心为HDFS和MapReduce,HDFS是一个高度容错性系统,提高吞吐量的数据访问,同时利用了Impala的开源组件;通过Sqoop将数据从mysql、oracle、mongodb数据库中导入Hive;通过Zookeeper提供数据同步服务,Impala是对hive对一个补充,可以实现高效的sql查询。

5.根据权利要求4所述的一种基于用户浏览轨迹推的大数据建模系统,其特征在于,所述AI数据中台,包括:

兴趣源模块,基于MapReduce的数据预处理与聚合模块,用于对用户行为、实时上下文信息采用MapReduce并行模型进行预处理与聚合,得到对结果放入HBbase数据表中,利用Hive对HBase中的用户行为及上下文模型数据进行推理,找出感兴趣数据源;

马尔科夫模型模块,用户行为的浏览信息利用马尔科夫推荐模型建立模块,依据用户浏览轨迹补全后的结果建立马尔科夫转移矩阵,并将该矩阵存放到HBase表中,依据用户兴趣源中数据,利用余玄因子法计算出每个用户兴趣相似度,构成兴趣相似度矩阵,集合马尔科夫转移矩阵建立基于协同过滤的马尔科夫推荐模型;

画像算法模块,画像算法将会对用户分成三种情况考虑,即根据用户访问数量多少,分为冷启动用户、低频访问用户和高频访问用户,并用于精确营销;

推荐算法模块,采用SLIM算法得到了一个的用户预测矩阵R,对每个用户根据预测矩阵R得到目标用户对各个业务的预测评分,将评分较高的业务推测给用户。

6.根据权利要求5所述的一种基于用户浏览轨迹推的大数据建模系统,其特征在于,

所述冷启动用户,采用默认标签,默认标签可以根据popularity来选择;

所述低频访问用户,包括根据历史数据将用户聚类;根据该用户少数的访问寻找聚类中心;将聚类中心的标签作为该用户可能的标签;

所述高频访问用户,采用频次统计的方法,输出该用户的精准画像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏三六五网络股份有限公司,未经江苏三六五网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911285236.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top