[发明专利]一种基于多个数据交互中心的数据进行信息推送的方法有效

专利信息
申请号: 201310039741.6 申请日: 2013-01-31
公开(公告)号: CN103118111B 公开(公告)日: 2017-02-08
发明(设计)人: 柏林森;苏萌;周涛;刘译璟;郭志金;周莹 申请(专利权)人: 北京百分点信息科技有限公司
主分类号: H04L29/08 分类号: H04L29/08
代理公司: 北京国昊天诚知识产权代理有限公司11315 代理人: 许志勇
地址: 100080 北京市海淀区北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于多个数据交互中心的数据进行信息推送的方法,包括从多个数据交互中心获取用户行为数据和数据项信息数据,通过统一数据平台进行数据整合得到用户的特征数据;根据得到的所述用户特征数据及该用户的当前行为信息判断得到该用户的行为意图数据;根据所述用户的用户行为意图数据生成与该用户当前行为匹配的推荐信息;向该用户发送推荐信息。本发明解决了如何将多个数据交互中心的数据进行数据统一并发送个性化信息给用户的问题。
搜索关键词: 一种 基于 数据 交互 中心 进行 信息 推送 方法
【主权项】:
一种基于多个数据交互中心的数据进行信息推送的方法,其特征在于,包括:从多个数据交互中心获取用户行为数据和数据项信息数据,通过统一数据平台进行数据整合得到用户的特征数据;其中,所述用户行为数据包括:用户选定行为数据和用户浏览行为数据;其中,所述用户选定行为数据包括:用户选定的数据项item_id、用户选定的数据项的特定数据价格price和用户选定数据项的数量quantity;所述用户浏览行为数据包括:用户浏览的数据项item_id;所述数据项信息数据包括:数据项所在的数据交互中心client_id、数据项在所述数据交互中心上的标识信息item_id、数据项的名称item_name、数据项的分类cat、数据项的关键词key_word、price数据项的特定数据、数据项的描述introduce、数据项被浏览的次数browse_times、数据项被选定的次数buy_times、数据项的评分score和数据项的评论reviews;根据得到的所述用户特征数据及该用户的当前行为信息判断得到该用户的行为意图数据;根据所述用户的用户行为意图数据生成与该用户当前行为匹配的推荐信息;向该用户发送推荐信息;所述根据得到的所述用户特征数据及该用户的当前行为信息判断得到该用户的行为意图数据的步骤,包括:获取所述用户的浏览行为并计算该用户的浏览特征;根据该用户的浏览特征计算得到该用户的行为意图数据;其中用户的行为意图数据包括:用户意图类目、用户意图类目下的意图标签和用户意图值;所述获取所述用户的浏览行为并计算该用户的浏览特征的步骤,包括:分析用户的浏览时间特征,通过该用户浏览时间间隔获取该用户的浏览时间特征,其中所述浏览时间特征包括浏览时间间隔均值和浏览时间间隔标准差;分析用户浏览数据项的特征,通过该用户浏览数据项的相似性获取用户浏览数据项的特征,其中所述浏览数据项的特征包括用户浏览数据项的类目、行为和标签相似性特征;所述根据所述用户的浏览特征计算得到所述用户的行为意图数据的步骤,包括:计算所述用户的用户意图类目,通过所述用户浏览数据项的类目信息计算用户最感兴趣的类目,并将所述类目作为该用户的用户意图类目;计算所述用户的用户意图类目下的意图标签,通过所述用户意图类目计算用户在所述类目下最感兴趣的标签集,并且所述标签集作为所述用户在所述用户意图类目下的意图标签;计算所述用户的用户意图值,通过所述用户的浏览特征计算所述用户的意图值,其中采用逻辑回归的方式将所述用户的浏览特征映射为在0至1区间中的一个值,并将所述值作为所述用户的用户意图值;其中,所述浏览时间间隔的均值的计算方式为:时间间隔的标准差计算方式为:获取用户浏览数据项的时间间隔,若用户只有一次浏览时间,则时间间隔为0,若有n次浏览行为{t1,t2,…tn},其中ti表示用户浏览数据项的时间,则时间间隔为其中,进一步,获取用户的浏览数据项的序列,若用户只有1次浏览行为,则用户浏览数据项的类目、行为、标签相似性特征均记为0,若有k(k>1)个浏览数据项{I1,I2,…Ik},则浏览数据项的类目相似性特征的计算方式为:F3=Σi=1k-2Sim1(Ii,Ii+1)k-1,(k>1,0<Sim1<1)]]>其中,depth(Ii)∩depth(Ii+1)表示Ii,Ii+1的公共路径深度,depth(Ii)∪depth(Ii+1)表示各自路径深度减去公共路径深度,depth(Ii)表示数据项Ii的类目树深度;浏览数据项的标签相似性特征的计算方式为:F4=Σi=1k-2Sim2(Ii,Ii+1)k-1,(k>1,0<Sim2<1)]]>其中,tag(Ii)∩tag(Ii+1)表示Ii,Ii+1的公共标签数量,tag(Ii)∪tag(Ii+1)表示各自标签数量减去公共标签数量,tag(Ii)表示数据项Ii的标签集合;浏览数据项的行为相似性特征的计算方式为:F5=Σi=1k-2Sim3(Ii,Ii+1)k-1,]]>其中,act(Ii)∩act(Ii+1)表示Ii,Ii+1的共有行为数,act(Ii)∪act(Ii+1)表示各自行为数减去共有行为数,act(Ii)表示对数据项Ii有浏览行为的用户集合;其中,所述计算所述用户的用户意图类目包括:计算用户浏览过所有类目的意图,最后取前m个作为意图类目,m取2或3,其中每个类目c的意图计算方式为:Intention(c)=λ0+λ1·num(c)+λ2·time(c)其中,num(c)表示用户浏览类目c的次数,time(c)表示用户浏览类目c的停留时间,λ0、λ1、λ2为离线计算的参数;其中,计算所述用户的用户意图类目下的意图标签包括:读取意图类目下所有数据项的标签,并且每个数据项作为一个单独实体,最后采用TF‑IDF计算所有标签的权重,并返回前K个权重最高的标签作为该意图类目下的意图标签,K为10‑30;其中,计算所述用户的用户意图值包括:通过逻辑回归方法计算用户的意图值,其计算方式如下:f(x)=11+e-βTx]]>其中,βTx=a0+a1·F1+a2·F2+a3·F3+a4·F4+a5·F5,F1,F2,F3,F4,F5表示用户的浏览特征,a0、a1、a2、a3、a4、a5为离线计算的参数,f(x)表示用户的意图值,该意图值直接表示用户的行为意图的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百分点信息科技有限公司,未经北京百分点信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310039741.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top