[发明专利]基于共同序列模式的、用于智能客户服务的分析系统和方法有效
申请号: | 201210439999.0 | 申请日: | 2012-10-29 |
公开(公告)号: | CN103793284B | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 陈超;付宇;钟钱杰;刘晶晶;陈齐彦 | 申请(专利权)人: | 伊姆西公司 |
主分类号: | G06F11/00 | 分类号: | G06F11/00 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 共同 序列 模式 用于 智能 客户 服务 分析 系统 方法 | ||
1.一种信息分析方法,包括:
基于源信息集合生成元数据集合,所述元数据包括错误日志信息,所述错误日志信息在所述元数据集合中构成错误序列;
为多个所述元数据集合生成共同错误序列集合;
筛选所述共同错误序列集合以确定无效模式;以及
将所述无效模式更新到模式黑名单列表中以用于将来的筛选。
2.根据权利要求1所述的方法,其中所述元数据还包括时间信息,并且所述方法进一步包括:
在所述元数据集合中归一化所述时间信息。
3.根据权利要求1所述的方法,进一步包括:
在所述元数据集合中去除重复的错误日志信息。
4.根据权利要求3所述的方法,其中所述去除重复的错误日志信息进一步包括去除以下中的一个或多个类型的消息:
完全相同的错误日志、仅非关键部分不同而其它部分完全相同的错误日志、关键部分相同的错误日志、用户认定为重复的错误日志。
5.根据权利要求3所述的方法,其中所述去除重复的错误日志信息进一步包括通过机器学习进行和/或由用户进行。
6.根据权利要求1-5之任一所述的方法,其中所提取的元数据为设定时间段内的元数据和/或来自设定的源。
7.根据权利要求1-5之任一所述的方法,其中为多个所述元数据集合生成共同错误序列集合进一步包括:
为多个所述元数据集合中的每两个所述元数据集合生成共同错误序列集合;以及
将所生成的每两个所述元数据集合的共同错误序列集合合并为所述多个元数据集合的共同错误序列集合。
8.根据权利要求7所述的方法,其中为多个所述元数据集合中的每两个所述元数据集合生成共同错误序列集合为并行进行。
9.根据权利要求7所述的方法,其中将所生成的每两个所述元数据集合的共同错误序列集合合并为所述多个元数据集合的共同错误序列集合进一步包括:
统计每个共同错误序列出现的次数。
10.根据权利要求1-5之任一所述的方法,其中所述错误序列标识所述错误日志信息之间的联系。
11.根据权利要求1-5之任一所述的方法,其中所述源信息包括与以下中的一个或多个相关的信息:应用程序日志、系统事件、系统日志、流程堆栈、线程堆栈、用户记录、应用程序记录;和/或
所述错误日志信息包括与以下中的一个或多个相关的信息:运行时错误、警告、调试。
12.根据权利要求1-5之任一所述的方法,其中所述元数据进一步包括日志等级和/或所述错误日志信息的出处。
13.根据权利要求1-5之任一所述的方法,其中所述共同错误序列集合包括多个所述元数据集合中相同的错误日志信息构成的错误序列的集合。
14.根据权利要求13所述的方法,其中相同的错误日志信息构成的错误序列的长度大于设定阈值。
15.根据权利要求13所述的方法,其中所述相同的判断标准由用户设定。
16.一种信息分析系统,包括:
预处理装置,用于基于源信息集合生成元数据集合,所述元数据包括错误日志信息,所述错误日志信息在所述元数据集合中构成错误序列;
共同序列生成装置,用于为多个所述元数据集合生成共同错误序列集合;
用于筛选所述共同错误序列集合以确定无效模式的装置;以及
用于将所述无效模式更新到模式黑名单列表中以用于将来的筛选的装置。
17.根据权利要求16所述的系统,其中所述元数据还包括时间信息,并且所述系统进一步包括:
归一化装置,用于在所述元数据集合中归一化所述时间信息。
18.根据权利要求16所述的系统,进一步包括:
去重装置,用于在所述元数据集合中去除重复的错误日志信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西公司,未经伊姆西公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210439999.0/1.html,转载请声明来源钻瓜专利网。