[发明专利]消息异常度值的获取方法和装置有效
申请号: | 201510702448.2 | 申请日: | 2015-10-26 |
公开(公告)号: | CN105320765B | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | 胡仲义;彭贵平;邢玉辉 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 异常 获取 方法 装置 | ||
1.一种消息异常度值的获取方法,其特征在于,所述方法包括:
从非结构化文本消息中提取消息的主题和所述主题对应的概率;
获取所述消息的发送方信息;
将相同发送方信息的主题组成主题集合;
按照消息的发送时刻将所述主题集合中主题进行排序,以得到主题有序集合;
从所述主题有序集合中提取主题序列;
利用主题对应的概率计算所述主题序列的概率支持度,其中,所述概率支持度为所述主题序列发生的概率的值;
利用所述概率支持度计算全局背景值;
利用所述概率支持度和所述全局背景值,获取消息异常度值。
2.根据权利要求1所述的方法,其特征在于,所述按照消息的发送时刻将所述主题集合中主题进行排序,以得到主题有序集合具体包括:
从所述文本消息中提取非结构化文本消息的发送时刻;
按照消息发送时刻的先后顺序对主题进行排序,得到所述主题有序集合。
3.根据权利要求1所述的方法,其特征在于,所述从所述主题有序集合中提取主题序列具体为:
从所述主题有序集合的元素中提取一元序列和/或多元序列,构成一组主题序列,其中,所述一元序列包括一个主题,所述多元序列包括多个主题,且所述主题有序集合中同一非结构化文本消息中的两个主题构成的多元序列不包括在所提取的所述主题序列内。
4.根据权利要求1所述的方法,其特征在于,所述利用主题对应的概率计算所述主题序列的概率支持度具体为:
根据公式获取到主题序列的概率支持度,其中,αi为第i个主题序列,pj为第j个主题的概率,ψi为第i个主题序列集合,|Ru|为主题序列的数量,n为主题的数目,u为消息发送方。
5.根据权利要求4所述的方法,其特征在于,所述利用所述概率支持度计算全局背景值具体为:
根据公式获取到全局背景值,其中,|U|为消息发送方的数量,uj为第j个发送方。
6.根据权利要求5所述的方法,其特征在于,所述利用所述概率支持度和所述全局背景值,获取所述消息的异常度值具体为:
根据公式
获取到所述消息的异常度值,其中,Tabn为异常行为主题序列集合,sim(α,β)为序列α和序列β的相似度。
7.根据权利要求6所述的方法,其特征在于,在利用所述概率支持度和所述全局背景值,获取消息异常度值之后,所述方法还包括:
输出包含所述异常度值的异常信息。
8.根据权利要求1-7中任一项所述的方法,其特征在于,在从非结构化文本消息中提取消息的主题和所述主题对应的概率之前,所述方法还包括:
从文本消息中提取非结构化文本消息。
9.一种消息异常度值的获取装置,其特征在于,所述装置包括:
第一提取单元,用于从非结构化文本消息中提取消息的主题和所述主题对应的概率;
第一获取单元,用于获取所述消息的发送方信息;
处理单元,用于将相同发送方信息的主题组成主题集合;
排序单元,用于按照消息的发送时刻将所述主题集合中主题进行排序,以得到主题有序集合;
第二提取单元,用于从所述主题有序集合中提取主题序列;
第二获取单元,用于利用主题对应的概率计算所述主题序列的概率支持度,其中,所述概率支持度为所述主题序列发生的概率的值;
还用于利用所述概率支持度计算全局背景值;
还用于利用所述概率支持度和所述全局背景值,获取消息异常度值。
10.根据权利要求9所述的装置,其特征在于,所述排序单元具体用于:
从所述文本消息中提取非结构化文本消息的发送时刻;
按照消息发送时刻的先后顺序对主题进行排序,得到排序后的主题有序集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510702448.2/1.html,转载请声明来源钻瓜专利网。