[发明专利]一种基于社交网络图计算的通信行为识别方法有效
申请号: | 202010976683.X | 申请日: | 2020-09-16 |
公开(公告)号: | CN112153221B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 李静林;袁泉;罗贵阳;刘志晗;季述郧;高雅诗;王尚广;周傲 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/58 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 网络图 计算 通信 行为 识别 方法 | ||
1.一种基于社交网络图计算的通信行为识别方法,其特征在于,具体步骤如下:
步骤一、利用数据流接口抓取一个周期内某市区海量用户的通信记录,对通信记录进行清洗并以图数据形式存储在数据库中;
步骤二、根据通信记录,以所有用户为节点,用户间的通信行为为边构建通信社交网络;
步骤三、根据牛顿冷却定理,针对某时刻t进行每两个用户间亲密度的初始值计算;
用户A与用户B间的通信亲密度计算公式为:
T(A,B)=∑(a*logb(d))*ec*Δt
其中,(a*logb(d))*ec*Δt为每次通话产生的热度;a、b、c为控制亲密度冷却的速率固定值,Δt为每次通话起始时刻距当前时刻t的时间差,d表示本次通话时长;
亲密度T(A,B)初始值为当前时刻t之前,所有次通话产生的热度累加之和;
步骤四、根据通信社交网络,通过游走采样法初步挖掘目标用户A的社交子图:
步骤五、图卷积模型通过堆叠多层的若干节点卷积算子和边卷积算子,对社交子图中各节点交互进行建模,完成各节点状态的更新;
针对当前第t'次迭代,节点v状态的迭代更新公式如下:
表示节点v在第t'次迭代后的嵌入向量,数值在0和1之间;是第t'层节点及其邻居的通用节点卷积算子函数,是将边特征映射到节点特征的边卷积算子函数,w∈N(v);N(v)表示社交子图中节点v的邻居集;evw表示交互用户v和用户w构成的边的特征;
步骤六、概率图模型通过马尔可夫随机场完成社交子图中各节点状态的更新;
节点i的状态更新公式如下:
bi(xi)为节点i的更新概率值;为归一化常数;φi(xi,yi)为节点i的自身置信度,通过统计自身的长期通话特征进行概率预测得到;N(i)为节点i在社交子图中的邻居;mji(xi)为节点j对节点i的信任度,计算公式如下:
k∈N(j)\i表示k为节点j在社交子图中的邻居除去节点i以外的节点;ψji(xj,xi)为节点j和节点i间的通信置信度,定义用户A与用户B间通信亲密度更新公式为:
其中,Xl(xi,xj)表示在节点j和节点i间单次通话的置信概率,通过单次通话特征分析得到;n表示节点j和节点i间的通话次数;Sim(xi,xj)表示节点j和节点i间的相似度,采用节点间的余弦相似度得到;σ1和σ2表示概率图模型的内部参数;
步骤七、将步骤五和步骤六的两个结果对应的各用户的状态向量进行拼接,输入多范围门控单元,利用端到端学习法,输出各用户分别对应的概率结果;
步骤八、将各个用户根据概率结果,划分到白名单、黑名单或者待定名单中。
2.如权利要求1所述一种基于社交网络图计算的通信行为识别方法,其特征在于,所述步骤一中,用户周期T的长度根据实际情况决定;
通信记录为原始通信信息,包括主叫用户号码、被叫用户号码、呼叫发起时间、呼叫结束时间、通话时长和呼叫类型。
3.如权利要求1所述一种基于社交网络图计算的通信行为识别方法,其特征在于,所述步骤二中,通信社交网络是一个大型有向图G,由(V,E)表示;
其中,V表示具有用户特征的有限节点集合,dv表示每个节点的特征维度,包括用户个人信息、用户呼出次数,用户被叫次数,平均呼叫时长和平均呼叫成功率;xv表示节点v的特征;
E表示用户交互的一组边,边特征为de表示每个关系边e的特征维度,包括呼叫次数、呼叫总时长和亲密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010976683.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法、装置、电子设备及存储介质
- 下一篇:一种化学试管清洗装置