[发明专利]基于知识图谱的水车室故障诊断方法有效

专利信息
申请号: 202010045346.9 申请日: 2020-01-16
公开(公告)号: CN111311059B 公开(公告)日: 2023-08-29
发明(设计)人: 雷雨锦;冮杰;李振东 申请(专利权)人: 成都大汇物联科技有限公司
主分类号: G06Q10/0635 分类号: G06Q10/0635;G06Q50/06;G06F16/36;G06N3/0464;G06N3/0442
代理公司: 北京正华智诚专利代理事务所(普通合伙) 11870 代理人: 代维凡
地址: 610041 四川省成都市中国(四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 知识 图谱 水车 故障诊断 方法
【权利要求书】:

1.一种基于知识图谱的水车室故障诊断方法,其特征在于,包括以下步骤:

S1、根据水车室机械故障诊断知识构建水车室故障知识图谱,所述水车室机械故障诊断知识包括结构化数据、半结构化数据以及非结构化数据;

S11、收集水车室机械故障诊断知识;

S12、从机械故障诊断知识的半结构化数据以及非结构化数据中提取实体、关系以及事件,组成初始三元组知识图谱;

所述水车室机械故障诊断知识、所述水车室检测数据和所述水车室故障模式数据均是从水轮发电机组监控系统获取;所述水车室机械故障诊断知识的结构化数据指的是水车室的传感器检测数据;所述水车室机械故障诊断知识的半结构化数据指的是试验报告数据和工作票数据;所述水车室机械故障诊断知识的非结构化数据指的是案例库数据;

其中,水车室机械故障诊断知识的半结构化数据以及非结构化数据,通过谷歌的Bert模型在BiLSTM-CRF模型上进行预训练,继而识别出实体的方法具体如下:

1)将原始文本数据转化为tfrecord形式或dataset形式读取,并使用IOB标注法制作标签;

2)使用Bert模型进行Embedding,加载google预训练的Bert模型,在网络上继续反向传播训练,不断调整原有模型的权重,获得一个适用于命名实体识别任务的模型;

其中,对于Bert-BiLSTM-CRF网络,Bert模型的输出为词向量,Bert模型对输入的中文句子最大长度为512个字;

3)将Bert模型的输出喂入BiLSTM+CRF网络,利用BiLSTM自动化地提取特征,

并将BiLSTM的输出结果输入到CRF中;

4)使用CRF对各标签的之间的转移概率进行建模,在所有的标签序列中,选取一条最优结果;

其中,选取一条最优结果的方法为:在CRF内部,随机初始化一个[tag_size,tag_size]的矩阵A,tag_size为标签的个数,Aij为标签i到标签j的转移概率,使用矩阵A对一个标签序列计算一个分值,其公式如下:

其中,X为观测到的语句,y为X的标签序列,T为句子的长度,为t-1时刻的标签转移到t时刻标签的值,从标签转移矩阵A中获得;为t时刻BiLSTM的输出值,并用以下公式将分值转换成概率:

在所有的标签序列中,利用Viterbi算法找出分值最大的标签序列,作为提取的实体;

使用基于文本的卷积神经网络从水车室机械故障诊断知识的半结构化数据以及非结构化数据中抽取各实体之间的关系;采用基于模式匹配的方式获取由实体和关系构成的事件;

S13、将机械故障诊断知识的结构化数据和初始三元组知识图谱进行知识融合,得到新的三元组知识图谱;

S14、对新的三元组知识图谱进行质量评估,利用其中合格的知识构成所述水车室故障知识图谱。

S2、对水车室机械故障诊断知识的结构化数据进行预处理,所述预处理包括数据异常值修改及数据补全;

S3、从预处理后的结构化数据中提取若干时序特征数据,并将时序特征数据按时间维度划分为两部分,该两部分时序特征数据分别构成Bayes网络结构训练样本数据集和Bayes网络参数训练样本数据集;

S4、根据Bayes网络结构训练样本数据集,以及Bayes网络结构训练样本数据集对应时刻的水车室故障模式数据,学习得到Bayes网络结构;

S5、将Bayes网络参数训练样本数据集输入Bayes网络结构中进行参数学习,得到Bayes网络;

S6、选择水车室检测数据进行步骤S2所述的预处理后,输入Bayes网络中,计算水车室在所选择水车室检测数据对应时间点发生故障的概率;

S7、根据所述水车室故障知识图谱以及在所选择水车室检测数据对应时间点发生故障的概率,得到在所选择水车室检测数据对应时间点水车室故障发生的原因、故障部位以及处理措施。

2.根据权利要求1所述基于知识图谱的水车室故障诊断方法,其特征在于,所述步骤S13中,知识融合指的是将若干相关数据源进行关联或者合并,其包括实体对齐和共指消解。

3.根据权利要求1所述基于知识图谱的水车室故障诊断方法,其特征在于,所述步骤S14中,对新的三元组知识图谱进行质量评估的方法是:对知识的置信度进行量化,舍弃置信度较低的知识,保留置信度较高的知识作为所述合格的知识。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都大汇物联科技有限公司,未经成都大汇物联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010045346.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top