[发明专利]一种基于社交网络的用户数据预测方法有效
申请号: | 202010473248.5 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111667106B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 傅晨波;夏镒楠;高诚裕;何浩男;邱君瀚;李一帆;岳昕晨 | 申请(专利权)人: | 苏州唯智互动传媒有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/04;G06N3/08 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 尹益群 |
地址: | 215000 江苏省苏州市常熟*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 网络 用户 数据 预测 方法 | ||
1.一种基于社交网络的用户行为预测方法,其特征在于,所述方法包括以下步骤:
S1:获取用户的行为数据以及其相对应的朋友行为数据构建成初始数据集,行为数据包括但不限于用户历史上访问过的地点及其对应的时间数据;
S2:基于用户去过的地点数据构建用户行为影响网络;
S3:针对用户行为影响网络运行随机游走算法对用户行为数据进行采样;
S4:初始化序列预测模型;
S5:将采样得到的用户行为数据与用户原始行为数据融合成最终数据集输入到序列预测模型中进行训练;
S6:将新采集到的用户行为数据输入到训练好的模型中,输出即为用户接下来可能要去的地点;
所述步骤S2包括以下步骤:
S2.1:对于初始数据集中的所有地点数据进行自适应的DBSCAN聚类;
S2.2:按以下规则构建用户行为影响网络:
2.2.1.用户和其所有的朋友构建成一个网络,网络中的节点是用户去过的地点;对于用户来说,连边构建规则是用户前一次去过的地点节点指向用户后一次去过的地点节点;对于用户的朋友来说,也是根据朋友前一次去过的地点节点指向朋友后一次去过的地点节点;对于用户地点节点和朋友地点节点之间的连边,按以下规则建立:记朋友去过的一个地点节点为A,访问A节点的时刻为Ta,用户去过的一个地点节点为B,访问B节点的时刻为Tb,若Tb-Ta<t,其中t是一个可调参数,那么地点A节点和地点B节点之间建立连边;
2.2.2.网络中连边的权重按以下规则建立,用户行为数据上的连边以及朋友行为数据上的连边,权重都为1,而用户和朋友间的连边,权重按以下公式计算:
其中Calter和Cego分别表示朋友行为节点和用户行为节点在经过S2.1处理之后,各自所属的类别,是前后两节点的时间差,Accmax是人类预测极限,它由以下公式计算得到:
h(a|b)=H(Accmax)+(1-Accmax)log2(Lb-1) (5)
H(Accmax)=-Accmaxlog2(Accmax)-(1-Accmax)log2(1-Accmax) (6)
其中La表示用户的数据长度,Lb表示用户朋友的数据长度,
表示两次行为之间的距离特征,α和β是一组可调参。
2.根据权利要求1所述的一种基于社交网络的用户行为预测方法,其特征在于:所述步骤S1包括以下步骤:
S1.1:采集ego用户的移动行为记录;
S1.2:采集alter用户列表及其移动行为记录;
S1.3:对ego数据和alter数据进行筛选,获取ego用户最早行为的时间ta和最晚行为的时间tb,去除alter数据在[ta,tb]之外的数据。
3.根据权利要求1或2所述的一种基于社交网络的用户行为预测方法,其特征在于:所述步骤S3包括以下步骤:
S3.1:数据的采样是从用户行为影响网络的入度为1的一个用户行为节点出发的,将连边的权重值作为转移概率值,逆向的进行采样;如果采样到的行为节点来自用户,那么采样继续进行下去,如果采样到的行为节点来自朋友,那么在采样了一定的深度dp之后,转移到时间上最相近的用户行为节点上,使采样继续进行下去,dp是一个可调参数;
S3.2:在每个用户上运行上述采样算法的次数根据用户的朋友数量而定,同时采样次数不能超过指定的最大次数L,这里L是一个可调参数,默认值为5;
所述步骤S4的过程为:对行为预测模型的权重参数进行初始化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州唯智互动传媒有限公司,未经苏州唯智互动传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010473248.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理