[发明专利]一种核电材料服役性能信息提取方法在审
申请号: | 201910604461.2 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110458397A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 刘啸天;张彦召;孙大健;张晏玮;薛飞;遆文新 | 申请(专利权)人: | 苏州热工研究院有限公司;中国广核集团有限公司;中国广核电力股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G06N20/00 |
代理公司: | 32103 苏州创元专利商标事务所有限公司 | 代理人: | 孙仿卫<国际申请>=<国际公布>=<进入 |
地址: | 215004江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核电厂 材料服役性能 信息提取 信息提取系统 服役性能 核电材料 机器学习 信息样本 样本库 清洗 分类标记 基于机器 排布规则 清洗系统 系统实现 规则表 排序 学习 | ||
本发明涉及一种核电材料服役性能信息提取方法,包括以下步骤:步骤1:利用基于机器学习的信息清洗系统和术语集与表达规则表,对由核电厂获取的各类与材料服役性能相关的信息进行处理,得到清洗后的信息;步骤2:采用人工方法对部分由核电厂获取的各类与材料服役性能相关的信息进行分类标记和信息提取,获得若干信息样本,再按照对应的排布规则对信息样本进行排序,获得样本库;步骤3:利用样本库进行机器学习而得到信息提取系统,利用信息提取系统处理清洗后的信息,得到所要提取的信息。本发明利用机器学习后的系统实现对核电材料服役性能信息的提取,可以提高信息提取的效率和准确性,适用于核电厂中对各类与材料服役性能相关的信息的处理。
技术领域
本发明属于核电厂信息处理领域,具体涉及一种核电材料服役性能信息提取方法。
背景技术
核电厂的材料服役性能是关于核电厂运行的安全性、可靠性和经济性的研究内容,是核电领域重要的研究方向。进行相关研究所需的相关的数据,种类繁多,数量巨大。同时由于国内核电厂的建设、运行经历了从无到有的摸索过程,设备、材料的国产化程度也从低到高,所以整个过程中各种数据的记录方式并不统一,同时数据的产生、传递过程的巨大差别也造成了数据种类多,整体结构化程度低。
针对现状,需要一种可以适用于大量、低结构化程度数据的核电厂服役性能信息提取方法。核电材料服役性能相关的数据描述的专业性、对于同类问题描述的差异性较大,还可能存在不同的缩写、简写、不规范表达等情况,现有的通用文本挖掘和处理技术无法直接应用,且面对核电厂与材料服役性能相关数据中普遍的短文本等问题也存在根本上的技术障碍。故需要一套适用于核电材料服役性能信息特征的数据清洗、模型训练方法和信息提取方法。
发明内容
本发明的目的是提供一种适用于核电厂信息处理,能够提高准确性和效率的核电材料服役性能信息提取方法。
为达到上述目的,本发明采用的技术方案是:
一种核电材料服役性能信息提取方法,包括以下步骤:
步骤1:数据清洗:利用基于机器学习的信息清洗系统和为提取材料服役性能相关信息所专门建立的术语集与表达规则表,对由核电厂获取的各类与材料服役性能相关的信息进行处理,从而得到清洗后的信息;
步骤2:建模:采用人工方法对部分由核电厂获取的各类与材料服役性能相关的信息进行分类标记和信息提取,从而获得满足数量要求的若干项信息样本,再按照对应的排布规则对各项所述信息样本进行排序,从而获得样本库;
步骤3:信息提取:利用所述样本库进行机器学习而得到用于提取信息的信息提取系统,利用所述信息提取系统处理清洗后的信息,从而得到所要提取的信息
所述步骤1中,所述信息清洗系统进行机器学习的方法为:建立核电材料服役性能专用术语集以及惯用表达规则表,利用所述核电材料服役性能专用术语集和所述惯用表达规则表进行机器学习而得到所述信息清洗系统。
所述步骤2包括以下子步骤:
子步骤a:目标信息筛选:按照与材料服役性能的相关性强弱,从部分由核电厂获取的各类与材料服役性能相关的信息中筛选出若干类待处理的信息;
子步骤b:确定分类方法:针对各类所述待处理的信息,确定其对应的分类原则和/或阈值;
子步骤c:人工标记:对各类所述待处理的信息,依据其对应的分类原则和/或阈值结合指定的标记原则进行人工分类标记和信息提取,从而获得所述信息样本;
子步骤d:样本排布:依据选定的排布规则将各项所述信息样本进行排序,从而获得所述样本库。
所述子步骤a中,筛选出的所述待处理的信息包括核电厂设备材料/机理分析数据、核电厂运行经验反馈信息、设备专项评估结论和审查结论。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州热工研究院有限公司;中国广核集团有限公司;中国广核电力股份有限公司,未经苏州热工研究院有限公司;中国广核集团有限公司;中国广核电力股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910604461.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:风险数据的监控方法和装置
- 下一篇:项目数据监控方法、服务器及存储介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理