[发明专利]一种基于用户行为的特征提取、个性化推荐的方法和系统有效

专利信息
申请号: 201310239508.2 申请日: 2013-06-17
公开(公告)号: CN104239324B 公开(公告)日: 2019-09-17
发明(设计)人: 张旭;杨志雄;李波;苏煜 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06Q30/02;G06Q30/06
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 赵娟
地址: 英属开曼群岛大开*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 用户 行为 特征 提取 个性化 推荐 方法 系统
【说明书】:

本申请实施例提供了一种基于用户行为的特征提取方法,包括:收集用户的原始行为信息,依据所述用户的原始行为信息生成用户行为数据点;所述用户行为数据点包括用户标识、维度标识及对应的维度分值;按照所述维度标识采用维度分值对所述用户行为数据点进行聚类,形成多个聚类空间;分别针对所述多个聚类空间中用户行为数据点的维度分值进行二值化;依据二值化的结果提取满足预设要求的一个或多个维度标识作为聚类空间的特征维度。本申请实施例采用了分布式计算,总体运算时间大幅减少。针对海量数据输入的条目超多和条目维度超多的问题,采用对数据分块计算的方法,对中间结果分块表达,解决了I/O过大问题。

技术领域

本申请实施例涉及数据处理技术领域,特别是涉及一种基于用户行为的特征提取的方法、一种基于用户行为的特征提取的系统、一种基于用户行为的个性化推荐的方法和一种基于用户行为的个性化推荐的系统。

背景技术

因特网Internet的迅猛发展将人们带入了信息社会和网络经济时代,对企业的发展和个人生活都产生了深刻的影响。同时,过量的信息使得人们无法高效地从中获取自己需要的部分,信息的使用效率反而降低。

以电子商务(ElectronicCommerce)为例,电子商务是在Internet开放的网络环境下,基于浏览器/服务器应用方式,实现消费者的网上购物、商户之间的网上交易和在线电子支付的一种新型的商业运营模式。随着Internet的爆发式发展,电子商务越加繁荣。由于供应链和物流的发展,商家能够在网上提供的商品种类和数量非常多,反而大大增加了消费者购物的时间成本,降低了电子商务平台的商品购买率。显然,用户既不愿意花费太多时间在漫无边际的网上寻找商品,也不可能像在现实生活中那种检查商品的质量。而是希望根据自身的兴趣爱好自动获取系统推荐的而且会感到满意的商品。因此根据不同的用户特征,把用户划分为不同的群组,进行有针对性的服务,是当前的应用热点之一。这样,聚类和特征提取也成为重要的应用。

目前的数据聚类系统大多是单机的,在处理大量数据时,除了运算时间过长,还存在输入/输出(I/O)负载过重的问题。当数据维度过多的时候,数据运算的中间结果过大,既不能放在内存中,又不能存储为文件保存,并且中间运算的I/O也会过大。换言之,当数据量过大时系统的硬件设备就会出现瓶颈,导致无法处理更大的数据量,显然这样的聚类系统是无法进行诸如电子商务的海量数据的聚类。

现有的技术也提出了用并行和分布式的方法进行大数据聚类处理,但是也存在分布式各个节点的交互、迭代等步骤的I/O压力过大的问题,即当数据量过大时系统硬件设备也会出现瓶颈,导致无法处理更大的数据量,显然也是无法进行诸如电子商务的海量数据的聚类。

现在的推荐系统很多是基于某种特征提取算法的,这种算法要求相当的业务知识,人工介入比较多,导致通用性差,人工成本高;电子商务涉及的行业广,要求通用性好,而且人工介入过多导致成本愈来愈大以致无法承受。再者,这种算法要在内存中进行运算,而且运算量大,运算时间长,受制于计算机硬件的承受能力,不适用于处理诸如电子商务的海量数据。最重要的是,该算法提取出不同用户群的特征,无法有效区分不同的用户群。

因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种适用于海量数据的处理的聚类及特征提取机制,根据不同的用户行为,把用户划分为不同的群组,提取能有效区分不同群组的特征,分别进行针对性的服务,提高服务的效率。

申请内容

本申请实施例所要解决的技术问题是提供一种基于用户行为的特征提取的方法及一种基于用户行为的个性化推荐的方法,能够基于用户的行为信息将用户划分为兴趣爱好相近的用户群,并提取出不同用户群的特征,使该特征可以区分不同的用户群,在个性化推荐时据此特征快速高效地进行推荐。

相应的,本申请实施例还提供了一种基于用户行为的特征提取的系统及一种基于用户行为的个性化推荐的系统,用以保证上述方法的实现及应用。

本申请实施例公开了一种基于用户行为的特征提取方法,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310239508.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top