[发明专利]一种基于用户行为数据分片聚类的建模推荐方法在审

专利信息
申请号: 201610828355.9 申请日: 2016-09-18
公开(公告)号: CN106339502A 公开(公告)日: 2017-01-18
发明(设计)人: 陆鑫;邓玉林 申请(专利权)人: 电子科技大学
主分类号: G06F17/30 分类号: G06F17/30;G06Q30/06;G06K9/62
代理公司: 成都点睛专利代理事务所(普通合伙)51232 代理人: 葛启函
地址: 611731 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及互联网个性化推荐技术,特别涉及一种基于用户行为数据分片聚类的建模推荐方法。它对用户行为数据进行分片聚类处理,建立用户动态兴趣模型,并以此实现个性化推荐。本发明与现有个性化推荐方法不一样的地方在于,现有个性化推荐方法仅仅考虑用户兴趣动态时变性情况,而本发明不仅考虑用户兴趣动态时变性,还能从行为数据中挖掘出具有多维性、离散性用户兴趣点,从而更精准地刻画用户兴趣模型。本发明还针对目标用户多维化和离散化的兴趣主题,为该用户各兴趣点并发进行初步推荐,最后按目标用户各兴趣点的权重、记忆度、初步推荐结果预测评分进行最终推荐,从而提高个性化推荐结果的精准度和处理性能。
搜索关键词: 一种 基于 用户 行为 数据 分片 建模 推荐 方法
【主权项】:
一种基于用户行为数据分片聚类的建模推荐方法,其特征在于,包括:a.用户行为数据定制处理,具体包括:a1.用户行为数据采集;所述用户行为数据是指用户通过互联网访问电商平台时,电商平台所采集的用户行为数据,至少包括登录、检索、浏览、购买和评价等类别数据,同时每一种用户行为数据均包含有电商平台赋予的基本属性信息,所述基本属性信息至少包括会话ID、用户ID、行为类型、行为内容、用户IP、登录设备和时间;a2.用户行为数据分片;具体是将步骤a1中采集的行为数据按用户进行组织,再以用户对电商平台的每次事务会话为单位,将用户行为数据按事务会话进行划分,使每个划分的行为数据片段仅包含一个事务主题,并将该用户包含相似主题词的行为数据片段进行归并处理;所述事务会话是指在用户登录电商平台时创建,并在用户结束访问后销毁的时间片段;b.通过用户行为数据聚类分析创建用公众用户兴趣模型,具体包括:b1.通过步骤a对不同用户的行为数据分片后,将每个行为数据片段作为一个类别,计算所有类别之间的相似度;具体为:假设有ui和uj两个行为数据片段,则它们的主题词集合相似度S(ui,uj)计算方法如下式:S(ui,uj)=|V(ui)∩V(uj)||V(ui)||V(uj)|]]>其中,S(ui,uj)代表行为数据片段ui和uj间的相似度,V(ui)和V(uj)分别代表行为数据片段ui和uj的主题词集合,在计算主题词集合的交集时,只有当检索主题词相同且具有相同词性时,才认为两个检索主题词是相同;b2.将所得的相似度最高的两个类别合并为一个类别,并采用两个类别的平均相似度作为新类别的相似度,重复步骤b2直至获得指定数量的类别为止;b3.从步骤b2最终获得的每个类别中抽取主题词作为兴趣主题,构建公众用户兴趣模型;c.电商平台对用户进行推荐,具体方法为:电商平台对目标用户的行为数据进行分析,从步骤b中获得的公众用户兴趣模型中找出目标用户的各个兴趣点,采用协同过滤算法分别进行初步推荐,然后再结合目标用户各兴趣点的权重、记忆度和初步推荐结果预测评分进行最终推荐,假设第i个兴趣点占目标用户兴趣的权重为λi,该权重的计算方法为:设定Si为目标用户第i个兴趣点,Len(Si)为兴趣点Si中包含的目标用户行为记录数目,则兴趣点Si占目标用户兴趣的权重λi计算方式如下式所示:λi=Len(Si)Len(S1)+Len(S2)+...+Len(Si)+...+Len(Sn)]]>根据用户兴趣点遗忘规律,使用遗忘函数h(t)对兴趣点λi权重进行处理;假定t为某用户兴趣点中最后一个行为记录发生时间到推荐时间的时间间隔,则用户兴趣点记忆度的计算方式如下式所示:h(t)=e‑t其中,t的单位为月;当最后的行为记录发生时间和推荐时间相同时,代表间隔为0,则h(0)=1,代表用户对该兴趣还未开始遗忘,最后,对用户各兴趣点的初步推荐结果进行加权计算排序,得到兴趣点排序列表P,假定目标用户有n个兴趣点,第i个兴趣点推荐结果的预测评分为pi,则兴趣点排序列表P的计算方式可以表示如下:P=Sort(p1*λ1*h(t1),p2*λ2*h(t2),p3*λ3*h(t3),…,pi*λi*h(ti),…,pn*λn*h(tn))其中,Sort()函数对目标用户各兴趣点的初步推荐结果预测评分、兴趣权重、记忆度进行加权计算,并将结果值排序处理,pi代表该用户兴趣点i的初步推荐结果预测评分,ti代表该兴趣点至推荐时间的间隔,h(ti)为用户对兴趣点i的记忆度,最后,根据兴趣点排序列表项计算值,选择列值最高的兴趣点推荐结果提供给目标用户,从而实现综合考虑用户时变性、多维性、离散性动态兴趣特点的个性化推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610828355.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top