[发明专利]一种核电厂质量缺陷报告与状态报告的精确匹配方法在审
申请号: | 202011240359.8 | 申请日: | 2020-11-09 |
公开(公告)号: | CN114462399A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 张冀兰;张廉;杨加东;杨朦;刘华;汤奔;梁军;杨沥铭;李强;刘晗 | 申请(专利权)人: | 中核核电运行管理有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06F16/903;G06Q10/06;G06Q50/06 |
代理公司: | 核工业专利中心 11007 | 代理人: | 孙成林 |
地址: | 314300 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 核电厂 质量 缺陷 报告 状态 精确 匹配 方法 | ||
1.一种核电厂质量缺陷报告与状态报告的精确匹配方法,其特征在于:包括以下步骤,
步骤1:设备编码计算规则;
步骤2:核电专用语义相似度计算规则;
步骤3:具体各电厂堆型的设备编码与语义相似度分值计算;
步骤4:关键词处理,增强经验反馈数据的有效性;
步骤5:智能推荐。
2.如权利要求1所述的一种核电厂质量缺陷报告与状态报告的精确匹配方法,其特征在于:所述的步骤1包括,
统计各种设备编码的规则,以及电厂与堆型之间的规则,将堆型和设备编码归类计算;
利用相关正则表达式判断该数据的设备编码是否符合其电厂的设备编码规则;
设备编码不符合该电厂的设备编码规则
如不符合,则基于自然语言处理将质量缺陷报告的“QDR主题”字段与状态报告中的“CR主题”字段剔除相关设备编码与相关干扰符号后根据语义相似度方法进行自然语言语义相似度匹配,对相似度的打分进行归一化,得到匹配分值w主题得分如果w主题得分大于等于给定的相关分值w限定分值,则计入集合S得分集合;
设备编码符合该电厂的设备编码规则
如果输入的设备编码符合该电厂的规则,获取质量缺陷报告的设备编码字段数据与已经预处理的数据库设备编码相关数据进行匹配比较:
具体设备编码匹配规则:
获取状态报告的涉及设备字段,与输入的设备编码进行完全匹配,相等则获得相关的设备编码分数,如果不相等,将两边设备编码去机组后再完全匹配,相等则获得相关的设备编码分数,如果不相等,将两边设备编码提取系统代码+设备编号后再完全匹配,相等则获得相关的设备编码分数,如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数,
如果以上规则都不成立,使用正则表达式提取主题等关系字段中的相关设备编码,与输入的设备编码进行完全匹配,相等则获得相关的设备编码分数,如果不相等,将两边设备编码去机组后再完全匹配,相等则获得相关的设备编码分数,如果不相等,将两边设备编码提取系统代码+设备编号后再完全匹配,相等则获得相关的设备编码分数,如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数。
3.如权利要求1所述的一种核电厂质量缺陷报告与状态报告的精确匹配方法,其特征在于:所述的步骤2包括,
在采用堆型和设备编码类型匹配的基础上,引入核电专用分词语义相似度匹配方法,达到更高的精确度,基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);动态规划查找最大概率路径,找出基于词频的最大切分组合;对于未登录词,采用了基于汉字成词能力的HMM模型,调用了Viterbi算法,根据分词结果调用余弦相似度算法获得相似度值;此处用输入的(质量缺陷报告)QDR主题和主题相关描述与状态报告的CR主题和相关字段进行语义相似度计算乘设定的权重得到语义相似度分值,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中核核电运行管理有限公司,未经中核核电运行管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011240359.8/1.html,转载请声明来源钻瓜专利网。