[发明专利]团伙挖掘方法、装置、设备及存储介质有效
申请号: | 201811102774.X | 申请日: | 2018-09-20 |
公开(公告)号: | CN110929141B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 杨双全;张阳;刘畅 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q50/00 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 团伙 挖掘 方法 装置 设备 存储 介质 | ||
1.一种团伙挖掘方法,其特征在于,包括:
获取各个用户的行为数据,所述行为数据包括第一行为数据和第二行为数据,所述第一行为数据为用户使用互联网、通信网络所产生的数据,所述第二行为数据为用户与其他用户在现实环境中接触所产生的数据,所述第一行为数据和第二行为数据包括多个类型的关联关系的数据;
根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重;
使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行自动拟合处理,确定任意两个用户之间的权重信息,所述多个调节参数为对包括已知团伙信息的训练样本进行学习后获取的;其中,所述调节参数的个数与所述关联关系的类型的个数相同,所述权重信息融合了各个类型的关联关系的数据;
根据所述任意两个用户之间的权重信息构建待挖掘的关联网络;
通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息;
所述根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重,包括:
根据所述各个用户的第一行为数据和第二行为数据,分别获取任意两个用户之间的关联频次,所述关联频次包括多个类型的关联关系的关联频次;
根据所述任意两个用户之间的关联频次,分别确定任意两个用户之间的多个类型的关联关系的权重。
2.根据权利要求1所述的方法,其特征在于,所述根据所述任意两个用户之间的关联频次,分别确定任意两个用户之间的多个类型的关联关系的权重,包括:
对于第d个类型的关联关系,根据所述任意两个用户的第一关联频次与所述任意两个用户的第二关联频次的比值,确定任意两个用户之间的第d个类型的关联关系的权重;
其中,所述任意两个用户的第一关联频次为所述任意两个用户之间的所述第d个类型的关联关系的关联频次,所述任意两个用户的第二关联频次为所述任意两个用户与其他用户之间的所述第d个类型的关联关系的关联频次,d分别取1至关联关系的类型总个数。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对于第k个用户和第l个用户,根据公式确定第k个用户与第l个用户的第二关联频次;
其中,表示第k个用户与第l个用户之间的第d个类型的关联关系的关联频次,N为所述各个用户的总个数,k和l分别取1至N中任意两个数。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行拟合处理,确定任意两个用户之间的权重信息,包括:
对于第k个用户和第l个用户,根据公式确定第k个用户和第l个用户之间的权重信息;
其中,表示第d个类型的关联关系中,第k个用户和第l个用户之间的权重信息,D为关联关系的类型总个数,分别表示一个类型的关联关系的调节参数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述任意两个用户之间的权重信息构建待挖掘的关联网络,包括:
分别根据所述任意两个用户之间的权重信息构建两个结点之间的带权值的边,获取待挖掘的关联网络,其中,每个结点表示一个用户。
6.根据权利要求5所述的方法,其特征在于,所述通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息,包括:
将每个结点作为一个初始团伙,分别计算所述结点加入到各个邻居结点后的模块度的变化量;
根据所述模块度的变化量,对初始团伙进行更新,获取更新后的团伙,将更新后的团伙作为新的结点,分别计算所述新的结点加入到各个邻居结点后的模块度的变化量;
当模块度不再变化时,输出更新后的团伙的团伙信息。
7.根据权利要求1至3、5至6任一项所述的方法,其特征在于,所述团伙信息包括属于同一团伙的各个用户的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811102774.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电饭煲
- 下一篇:一种饮料类豆腐及其再制品