[发明专利]核电文件校验处理方法以及系统在审
申请号: | 201811122661.6 | 申请日: | 2018-09-26 |
公开(公告)号: | CN109446345A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 白鹤;颜斯泰;王云福;涂红兵;侯斌;戴伟琦;马菁;刘婧;吴祥勇 | 申请(专利权)人: | 深圳中广核工程设计有限公司;中广核工程有限公司;中国广核集团有限公司;中国广核电力股份有限公司 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06F16/35;G06K9/34;G06K9/32;G06K9/46;G06Q10/06;G06Q50/06 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 蔡晓红;柯夏荷 |
地址: | 518100 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核电 非结构化 校验规则 元数据信息 配置信息 图片结构 文件校验 校验 录入 企业内容管理 企业内容 人力成本 生产效率 图像分割 图像识别 文档数据 文件类型 文字识别 校验处理 信息块 自动化 填补 分割 图片 | ||
本发明公开了一种核电文件校验处理方法以及系统,方法包括:从企业内容管理系统中获取非结构化核电文件及相关元数据信息;根据获取到的非结构化核电文件及相关元数据信息,基于预先录入的校验规则配置信息,获取校验规则;基于所述校验规则,对所述非结构化核电文件进行图像分割,并对分割出来的信息块图片进行文字识别以提取图片结构化信息;结合所述图片结构化信息,进行文档数据校验。本发明适用于包含图片的非结构化核电文件的校验处理,填补了核电企业内容自动化图像识别校验的空白,可以根据需求预先录入配置信息以实现针对不同的文件类型实现多样化定制校验规则,极大的提升了生产效率,降低人力成本。
技术领域
本发明涉及核电领域,尤其涉及一种核电文件校验处理方法以及系统。
背景技术
据统计,在核电建设项目中,工程总成本的约3%~5%是由信息传递的问题导致工程变更和工程实施的错误所造成的。核电工程企业内容信息数据复杂,文档资料数量庞大,达到百万级别,尤其是项目工程文件、技术文档、商务合同、往来函件及各技术路线(如AP1000、EPR三代核电技术)转让资料。由于技术资料大部分是以半结构化形式存储在企业内容管理系统(EnterpriseContent Management System,ECMS)中,信息量庞大。
核电文档结构化的元数据信息除了在信息平台中体现外,在非结构化的实体的工程文档文件中也有相应的体现,而工程实施过程中,在ECM中存储的元数据需要通过实体文件的形式展示给现场人员,因此核电文档信息的准确性直接影响了项目的建设实施,为了保证核电工程质量和核安全,文档的规范化检查与元数据匹配是的核电文档管理重要基础工作。
核电文档实行电子化、无纸化管理,电子化工作流审批及自动化数字签名大大提高了生产效率,但文档检查需要投入大量人力,成为文档流转的瓶颈。核电文档检查工作是一个复杂繁琐的事务性工作,每个工程设计文件需要进行多达24项,均需要人工核对检查,每天需要检查核对几百份工程文件与工程函件,消耗大量的人力与成本,而这种重复性的工作。
公开号为CN106815268A的发明申请公开了一种海量非结构化电子文件的结构化处理方法及系统。该发明仅从技术资料的实体电子文件的属性(如文件名称、大小、目录、哈希码等信息)进行了分析和提取,并未对非结构化文档的具体内容,尤其是图像内的数据信息进行进一步处理。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种核电文件校验处理方法以及系统。
本发明解决其技术问题所采用的技术方案是:构造一种核电文件校验处理方法,包括:
从企业内容管理系统中获取非结构化核电文件及相关元数据信息;
根据获取到的非结构化核电文件及相关元数据信息,基于预先录入的校验规则配置信息,获取校验规则;
基于所述校验规则,对所述非结构化核电文件进行图像分割,并对分割出来的信息块图片进行文字识别以提取图片结构化信息;
结合所述图片结构化信息,进行文档数据校验。
优选的,所述方法还包括:
在进行图像分割之前,对所述非结构化核电文件进行预处理,所述预处理包括:对所述非结构化核电文件先后进行灰度处理、二值化处理、滤波降噪处理以及图片倾斜矫正。
优选的,所述方法还包括:
提取所述非结构化核电文件的颜色信息,获取校验所需要的文件属性信息;
在进行图像分割之后,识别信息块图片的清晰度;
在进行文档数据校验时,基于所述校验规则,对提取出的所述图片结构化信息、清晰度信息、提取到的颜色信息文件以及获取到的文件属性信息进行综合校验,导出校验结果给结果显示用户接口,并提供各项校验结果的说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中广核工程设计有限公司;中广核工程有限公司;中国广核集团有限公司;中国广核电力股份有限公司,未经深圳中广核工程设计有限公司;中广核工程有限公司;中国广核集团有限公司;中国广核电力股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811122661.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的智能分析报告自动生成系统
- 下一篇:多媒体资源编辑方法及装置