[发明专利]一种将设备故障语句描述转换为知识图谱表达的方法有效
申请号: | 201811311648.5 | 申请日: | 2018-11-06 |
公开(公告)号: | CN109189946B | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李长云 | 申请(专利权)人: | 湖南云智迅联科技发展有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q10/00 |
代理公司: | 长沙市和协专利代理事务所(普通合伙) 43115 | 代理人: | 王培苓 |
地址: | 410000 湖南省长沙市高新开发区尖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设备 故障 语句 描述 转换 知识 图谱 表达 方法 | ||
1.一种将设备故障语句描述转换为知识图谱表达的方法,其特征在于,所述方法包括:
(一)、构建词典,包括构建设备及组件词典、状态词词典、程度词词典、同义词词典,还包括构建关系词典,所述关系词典用于存储:A、设备及组件词典中的对象之间的层级关系,B、设备及组件与状态之间的关系;
(二)、构建用于知识图谱转换的句型模板表,将常见故障现象描述根据句型进行分类,并根据分类构建句型模板表,所述句型模板表至少包括不同的句型模板格式、及不同的句型模板格式相对应的语义图谱格式片段、及扩展语义图谱格式片段;
基于设备及组件词典、状态词典、程度词词典、限定词词典对样本中的故障现象描述进行分词,分别用实体、状态、程度词、限定词来标记得到的分词结果,将故障现象描述转化为实体、状态词、程度词、限定词的组合,即句型模板;
句型模板中的实体和实体、实体和状态之间的基本关系转换为语义图谱片段,以及将句型模板中的实体和实体、实体和状态之间的拓展关系转换为扩展语义图谱片段,所述语义图谱片段和扩展语义图谱片段中的关系与关系词典中的关系相对应;
每个所述句型模板对应一个默认的语义图谱片段和一个或多个扩展语义图谱片段;根据句型模板生成语义图谱片段、存储,具体方法如下:
在数据库中建立basicInfo表,将设备及组件词典、状态词典都存入basicInfo表,每个词都有一个ent_Id,同义词存入synonym表中,将程度词存入adv表,将限定词存入pre表,所有的句型模板及对应的图谱片段、扩展图谱片段存入template表;
建立relation表用于存储词之间的关系,该表包含relation_id,fromEnt,toEnt,relation_value四个字段,表示fromEnt与toEnt之间具有“relation_value”的关系,若实体、状态有附加的程度词、限定词,则一起写入相应的字段;
建立originalInfo表,存储历史维修记录,同时增加三个字段分别存储语义图谱片段id,扩展语义图谱片段id和图谱id;
(三)、将供检索用的设备维修知识库中的历史故障现象描述进行分词、同义置换;
(四)、根据步骤(三)所得故障现象描述的句型在句型模板表中找到相匹配的句型模板格式,然后根据该句型模板格式相对应的语义图谱格式片段在关系词典中找到相对应的语义片段,同理找到扩展语义片段,并将找到的句型模板格式、语义片段、扩展语义片段分别相对应的标识符存储进设备维修知识库中的历史故障现象描述相对应的句型模板格式字段、语义图谱片段字段、扩展语义图谱片段字段;
(五)、词典扩展,对于不可完全分词的故障现象描述进行处理,将得到的设备及组件、状态加入到现有词典中。
2.根据权利要求1所述的一种将设备故障语句描述转换为知识图谱表达的方法,其特征在于,所述设备及组件词典用于收录所述设备故障语句描述的对象,所述状态词词典用于收录所述对象的故障或状态,所述程度词词典用于收录设备或组件状态描述中的程度描述词,所述同义词词典用于列举所有语义相同的词及转换同义词为标准词,所述限定词词典是为设备及组件词典、状态词典中未包含的词而提出的,用于收录对设备及组件和对状态进一步限定的词。
3.根据权利要求1所述的一种将设备故障语句描述转换为知识图谱表达的方法,其特征在于,所述步骤(一)构建关系词典时,对设备及组件附加的程度词、限定词一起写入相应的字段,程度词和限定词分别加前缀识别。
4.根据权利要求1所述的一种将设备故障语句描述转换为知识图谱表达的方法,其特征在于,所述步骤(三)还包括通过分界符将故障现象描述分为多个句子,将每个句子采用前向最大匹配算法对故障现象描述进行分词,提取出程度词,然后再基于设备及组件词典、状态词典、限定词词典,采用前向最大匹配算法进行分词,提取出设备及组件、状态、限定词,然后根据同义词词典将同义词置换为标准词;
分词后可根据每个词属于的词典进行标注实体、状态、程度词、限定词,得到每个故障现象描述所匹配的句型模板,然后将故障现象描述根据句型模板格式中的知识图谱、扩展知识图谱的标识符存储。
5.根据权利要求1所述的一种将设备故障语句描述转换为知识图谱表达的方法,其特征在于,所述步骤(四)还包括:创建设备故障知识数据库,在数据库中建立设备及组件词典表,将设备及组件词典、状态词典都存入设备及组件词典表,所述设备及组件词典表至少包括记录标识字段、内容字段,并在数据库中创建同义词词典表、程度词词典表、限定词词典表、句型模板表和存入上述的同义词词典、程度词词典、限定词词典、句型模板表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南云智迅联科技发展有限公司,未经湖南云智迅联科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811311648.5/1.html,转载请声明来源钻瓜专利网。