[发明专利]一种确定用户关系的方法及装置在审
申请号: | 201810235665.9 | 申请日: | 2018-03-21 |
公开(公告)号: | CN110310138A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 荣钰;黄俊洲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/00;G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集合 聚类结果 时间样本 操作行为 聚类中心 目标用户 潜在关系 时间数据 行为序列 用户关系 聚类 存储介质 获取目标 集合生成 数据特征 用户交互 用户组 预设 网络 发现 | ||
1.一种确定用户关系的方法,其特征在于,包括:
获取目标用户组的行为序列集合;
基于所述行为序列集合生成时间样本集合,所述时间样本集合包括选用用户对的操作行为的时间间隔,所述时间间隔为所述选用用户对中两个用户对同一网络事件的相同操作行为的时间间隔,所述选用用户对中的用户包含于所述目标用户组,且所述选用用户对的相同操作行为次数大于第一预设值;
对所述时间样本集合中所述选用用户对的相同操作行为的时间间隔进行时间数据聚类,所述时间数据聚类包括聚类结果集合以及所述聚类结果集合中的各聚类结果对应的聚类中心集合;
基于所述聚类结果集合以及所述聚类结果集合中的各聚类结果对应的聚类中心集合分别计算所述选用用户对的关系分数;
将所述关系分数大于第二预设值的用户对确定为目标用户对,所述目标用户对中的两个用户存在潜在关系。
2.根据权利要求1所述的方法,其特征在于,所述基于所述行为序列集合生成时间样本集合之前,所述方法还包括:
基于所述行为序列集合确定所述目标用户组中所有用户对的相同操作行为次数;
将所述所有用户对的相同操作行为次数大于所述第一预设值的用户对确定为所述选用用户对。
3.根据权利要求2所述的方法,其特征在于,所述基于所述行为序列集合生成时间样本集合包括:
提取所述选用用户对在所述多个行为序列中的操作行为时间信息;
根据所述选用用户对在所述多个行为序列中的操作行为时间信息确定所述选用用户对的所有操作行为的时间间隔,以得到所述时间样本集合。
4.根据权利要求1-3中任一所述的方法,其特征在于,所述对所述时间样本集合中所述选用用户对的相同操作行为的时间间隔进行时间数据聚类,包括:
通过预设聚类算法将所述时间样本集合中的各时间间隔分别代入操作行为时间聚类函数进行求解,以得到所述目标用户对集合中的选用用户对的用户行为时间数据聚类。
5.根据权利要求4所述的方法,其特征在于,所述操作行为时间聚类函数为:
其中,所述C为所述聚类结果集合,所述H所述聚类结果集合C中的各聚类结果对应的聚类中心集合,所述ci为所述聚类结果集合C中的任一聚类结果,所述sj为所述时间样本集合中的任一时间样本,所述X为将映射到成|M|维的向量,所述为累积概率函数,且
其中,1{tk≤x}为采样t小于x的指示函数,所述x为所述时间样本集合中的任一时间样本的具体值,所述采样t为空间域里所述时间样本集合中的任一时间样本,m为所述时间样本集合中的时间样本个数。
6.根据权利要求5所述的方法,其特征在于,所述基于所述聚类结果集合以及所述聚类结果对应的聚类中心集合分别计算所述选用用户对的关系分数,包括:
通过如下公式计算所述目标用户对的关系分数:
其中,所述Δi为所述ci中出现的所述时间样本集合中的时间样本的平均时间间隔,所述hi为所述H中的任一聚类中心,所述d(hi,sj)为所述时间样本之间的距离。
7.根据权利要求1‐6中任一项所述的方法,其特征在于,所述目标用户组包括M个目标用户,所述行为序列集合包括多个行为序列,其中,每个行为序列包括M个目标用户中N个目标用户对所述同一网络事件的相同操作行为的发生时间,所述M为大于2的整数,所述N为大于2的整数,且所述N小于所述M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810235665.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种广告投放方法和装置
- 下一篇:数据投放方法以及数据投放引擎装置