[发明专利]垃圾短信发送号码实时检测系统及方法有效
申请号: | 200810168774.X | 申请日: | 2008-09-28 |
公开(公告)号: | CN101686444A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 王晨;李洁;陆薇;田启明 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04L12/58 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 周少杰 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 垃圾 短信 发送 号码 实时 检测 系统 方法 | ||
1.一种垃圾短信发送号码实时检测系统,包括:
事件处理引擎,用于实时获取短信事件流,根据预定的时间参数及其规 则进行规则匹配,提取潜在的垃圾短信发送号码;以及
图分析引擎,用于接收事件处理引擎提取的所述号码,然后获取所述号 码的社会网络数据,结合至少一个预定的空间特征及其参数和规则,进行空 间行为模式分析,以便判定所述号码是否真正的垃圾短信发送号码,
其中所述预定的空间特征包括所述社会网络的一度子图、二度子图、三 度子图的以下特征:
中心结点的入度;
中心结点的出度;
中心结点的入度出度比;
连接中心结点的所有边中双向边所占比例;
连接中心结点的所有边的平均权重;
连接中心结点的所有边的最大权重;
连接中心结点的所有边的权重的方差;
中心结点的所有直接联系人结点之间的边数;
中心结点的所有直接联系人结点之间的边的平均权重;以及
中心结点的所有直接联系人结点之间的边的权重之和。
2.根据权利要求1所述的垃圾短信发送号码实时检测系统,其中图分析 引擎进行空间行为模式分析包括:
根据所述号码的社会网络数据计算所述空间特征的值,将每个计算的值 与该空间特征的参数和规则进行比较,得到对应于该空间特征的概率,然后 将所有空间特征的概率求加权和,得到垃圾短信可疑概率。
3.根据权利要求1所述的垃圾短信发送号码实时检测系统,其中图分析 引擎进行空间行为模式分析包括:
利用所述号码的社会网络数据作为训练样本,根据选择的分类方法进行 训练,得到用于垃圾短信发送号码检测的分类器,根据所述号码的社会网络 数据计算所述空间特征的值,然后将由所有计算的值构成的序列输入所述分 类器进行判别,得到垃圾短信可疑概率。
4.根据权利要求1所述的垃圾短信发送号码实时检测系统,还包括:
事务处理管理器,用于获取历史通信数据,将其预处理为特征数据;以 及
模式挖掘引擎,用于接收所述特征数据,对所述特征数据进行时间和空 间行为模式分析与学习,产生所述预定的时间参数及其规则以及所述预定的 空间特征及其参数和规则。
5.根据权利要求4所述的垃圾短信发送号码实时检测系统,其中对于空 间行为模式,模式挖掘引擎对所有特征进行聚类分析和验证,找到有效的特 征子集并得出适合的参数和规则。
6.一种垃圾短信发送号码实时检测方法,包括:
实时获取短信事件流,根据预定的时间参数及其规则进行规则匹配,提 取潜在的垃圾短信发送号码;以及
获取提取的所述号码的社会网络数据,结合至少一个预定的空间特征及 其参数和规则,进行空间行为模式分析,以便判定所述号码是否真正的垃圾 短信发送号码,
其中所述预定的空间特征包括所述社会网络的一度子图、二度子图、三 度子图的以下特征:
中心结点的入度;
中心结点的出度;
中心结点的入度出度比;
连接中心结点的所有边中双向边所占比例;
连接中心结点的所有边的平均权重;
连接中心结点的所有边的最大权重;
连接中心结点的所有边的权重的方差;
中心结点的所有直接联系人结点之间的边数;
中心结点的所有直接联系人结点之间的边的平均权重;以及
中心结点的所有直接联系人结点之间的边的权重之和。
7.根据权利要求6所述的垃圾短信发送号码实时检测方法,其中进行空 间行为模式分析包括:
根据所述号码的社会网络数据计算所述空间特征的值,将每个计算的值 与该空间特征的参数和规则进行比较,得到对应于该空间特征的概率,然后 将所有空间特征的概率求加权和,得到垃圾短信可疑概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810168774.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:管理指令处理方法、系统、指令管理中心和HLR
- 下一篇:背投影系统