[发明专利]一种基于贝叶斯和语义分析的运维知识库构建方法在审
申请号: | 202010108850.9 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111309928A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 莫穗江;梁英杰;李瑞德;王锋;张欣欣;温志坤;黄定威;廖振朝;杨玺;高国华;张欣;汤铭华;陈嘉俊;李伟雄;童捷;张天乙 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司江门供电局 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06F16/338;G06F40/289;G06F40/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈伟斌 |
地址: | 510600 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 语义 分析 知识库 构建 方法 | ||
1.一种基于贝叶斯和语义分析的运维知识库构建方法,其特征在于,包括电力通信网,所述电力通信网中包括数据库,包括以下步骤:
S1.在所述数据库中采集运维数据,然后对采集的运维数据按照类别设置属性;
S2.基于贝叶斯分类算法对步骤S1中得到的运维数据进行预处理,然后对完成预处理的运维数据进行挖掘,得到运维知识数据;
S3.构建运维知识库,并在所述运维知识库内建立检索引擎,采用产生式表示法将步骤S2中得到的运维知识数据存储至所述运维知识库中;
S4.基于语义分析算法,计算出所述运维知识数据与向所述检索引擎输入的检索词间的相近程度,并按权值大小的顺序显示检索结果。
2.根据权利要求1所述的一种基于贝叶斯和语义分析的运维知识库构建方法,其特征在于,所述步骤S2的具体步骤如下:
S21.关联规则挖掘阶段:基于关联规则挖掘算法对采集的运维数据通过置信度和支持度挖掘关联规则;
S22.预处理阶段:通过MapReduce框架对采集的运维数据进行预处理;
S23.模型训练阶段:计算各个属性的先验概率和联合概率;
S24.权值计算阶段:根据关联规则的置信度计算各个属性对应的权值,然后通过贝叶斯分类算法对所述关联规则进行分类;
S25.数据填充阶段的MapReduce实现:根据各个属性的值和权值对缺失的状态值进行填充。
3.根据权利要求2所述的一种基于贝叶斯和语义分析的运维知识库构建方法,其特征在于,在步骤S21中,通过以下公式进行关联规则的计算:
Support(X→Y)=P(XUY);
Confidence(X→Y)=P(X|Y);
其中,X={x1,x2,...,xk},Y={y1,y2,...,yk},
式中,X表示关联规则的前提,Y表示关联规则的结论事实,Support(X→Y)表示X→Y的支持度,Confidence(X→Y)表示X→Y的置信度,P(X∪Y)表示采集的运维数据中包含X∪Y的百分比,P(X|Y)表示采集的运维数据中既包含X又包含Y的运维数据的百分比,I表示频繁项集。
4.根据权利要求3所述的一种基于贝叶斯和语义分析的运维知识库构建方法,其特征在于,所述步骤S3的具体步骤如下:
S31.知识获取:通过所述运维知识数据构建运维知识库,然后在所述运维知识库内建立检索引擎;
S32.知识类聚:对步骤S2中得到的运维知识数据按照实体概念进行整理、抽取、划分、聚类;
S33.知识评审:对运维知识数据进行质量评估,确认运维知识数据是否具有价值,同时检查知识的冗余性、多义性、相容性与完整性,保证运维知识库无冗余、无二义性;
S34.知识表示:采用产生式表示法对运维知识数据进行存储。
5.根据权利要求4所述的一种基于贝叶斯和语义分析的运维知识库构建方法,其特征在于,所述步骤S31的具体步骤如下:
S311.在所述运维知识库中建立规则表,所述规则表包括所述关联规则;
S312.在所述运维知识库中建立故障表,所述故障表包括故障的基本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司江门供电局,未经广东电网有限责任公司;广东电网有限责任公司江门供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010108850.9/1.html,转载请声明来源钻瓜专利网。