[发明专利]一种基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统及方法在审
申请号: | 202210020929.5 | 申请日: | 2022-01-10 |
公开(公告)号: | CN114443425A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 孙文龙;刘其峰;孟建 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F16/18;G06F16/951;G06F40/247;G06F40/289 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 jieba 权重 计算 特征 打分 排序 算法 服务器 操作系统 日志 诊断 系统 方法 | ||
1.一种基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统,其特征在于:包括日志分析模块、近义词联想模块、日志诊断模块、结果集排序模块和展示建议模块;
日志分析模块用于对收集到的操作系统所有日志文件进行分析,筛选出日志信息及异常信息;
近义词联想模块用于对故障日志信息及异常信息进行近义词联想,形成问题专业词汇组合;
日志诊断模块用于调用爬虫对检索式进行本地和线上知识库检索;
结果排序模块用于对日志针对抓取的结果集进行分析建模,计算并排序出相关度结果;
展示建议模块用于展示当前服务器操作系统故障诊断信息。
2.根据权利要求1所述的基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统,其特征在于:日志分析模块将所有日志文件所有条目作为原始文本输入,使用Jieba分词算法对原始文本进行分词。
3.根据权利要求2所述的基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统,其特征在于:近义词联想模块对日志分析模块计算筛选出的故障报错条目,进行分词提取关键词组,并根据操作系统实际问题处理中的语境,进行特征近义词匹配。
4.根据权利要求3所述的基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统,其特征在于:日志诊断模块首先对检索式中关键词进行本地知识库正则匹配,记录匹配到的故障说明。
5.根据权利要求4所述的基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统,其特征在于:结果排序模块对日志诊断模块抓取的结果进行特征打分。
6.根据权利要求5所述的基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统,其特征在于:展示建议模块将直接命中的诊断方法和故障信息展示出来,将疑似挂账和建议方法按照排序结果展示。
7.一种基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断方法,其特征在于:该方法基于权利要求1-6任意一项所述基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断系统实现,针对服务器操作系统的日志文件,使用Jieba分词算法对日志文件原始文本进行分词,根据预设的关键词权重表对日志条目进行权重计算,识别和判断日志中的故障信息条目,并对报错信息进行近义词联想增加检索准确度和专业度,通过对本地知识库、操作系统厂商知识库及社区进行检索式搜索,对诊断结果集进行分析建模,打分计算并排序出前十相关度结果,实现全自动操作系统日志诊断。
8.根据权利要求7所述的基于Jieba权重计算及特征打分排序算法的服务器操作系统日志诊断方法,其特征在于:具体包括以下步骤:
S1、基于操作系统自带的日志收集工具一键收集服务器所有系统日志;
S2、调用日志分析模块,对收集到的操作系统所有日志文件进行分析,筛选故障日志信息及异常信息,对原始文本进行分词来构建词图;
S3、调用rank方法计算出该条日志条目具体的权重值;
S4、调用近义词联想模块,对故障报错信息进行近义词联想,形成问题专业词汇组合,增加检索准确度和专业度;
S5、调用日志诊断模块,通过本地知识库、操作系统厂商知识库、开源社区进行爬虫检索;
S6、调动结果集排序模块,对日志诊断抓取的结果进行分析建模,计算并排序出相关度结果;
S7、通过展示建议模块展示当前操作系统故障诊断信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210020929.5/1.html,转载请声明来源钻瓜专利网。