[发明专利]核电文件校验处理方法以及系统在审
申请号: | 201811122661.6 | 申请日: | 2018-09-26 |
公开(公告)号: | CN109446345A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 白鹤;颜斯泰;王云福;涂红兵;侯斌;戴伟琦;马菁;刘婧;吴祥勇 | 申请(专利权)人: | 深圳中广核工程设计有限公司;中广核工程有限公司;中国广核集团有限公司;中国广核电力股份有限公司 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06F16/35;G06K9/34;G06K9/32;G06K9/46;G06Q10/06;G06Q50/06 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 蔡晓红;柯夏荷 |
地址: | 518100 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核电 非结构化 校验规则 元数据信息 配置信息 图片结构 文件校验 校验 录入 企业内容管理 企业内容 人力成本 生产效率 图像分割 图像识别 文档数据 文件类型 文字识别 校验处理 信息块 自动化 填补 分割 图片 | ||
1.一种核电文件校验处理方法,其特征在于,包括:
从企业内容管理系统中获取非结构化核电文件及相关元数据信息;
根据获取到的非结构化核电文件及相关元数据信息,基于预先录入的校验规则配置信息,获取校验规则;
基于所述校验规则,对所述非结构化核电文件进行图像分割,并对分割出来的信息块图片进行文字识别以提取图片结构化信息;
结合所述图片结构化信息,进行文档数据校验。
2.根据权利要求1所述的核电文件校验处理方法,其特征在于,所述方法还包括:
在进行图像分割之前,对所述非结构化核电文件进行预处理,所述预处理包括:对所述非结构化核电文件先后进行灰度处理、二值化处理、滤波降噪处理以及图片倾斜矫正。
3.根据权利要求1所述的核电文件校验处理方法,其特征在于,所述方法还包括:
提取所述非结构化核电文件的颜色信息,获取校验所需要的文件属性信息;
在进行图像分割之后,识别信息块图片的清晰度;
在进行文档数据校验时,基于所述校验规则,对提取出的所述图片结构化信息、清晰度信息、提取到的颜色信息文件以及获取到的文件属性信息进行综合校验,导出校验结果给结果显示用户接口,并提供各项校验结果的说明。
4.根据权利要求1所述的核电文件校验处理方法,其特征在于,所述的对所述非结构化核电文件进行图像分割,包括:
对所述非结构化核电文件中的图片进行图片边缘识别;
对识别出边缘的图片进行倾斜校正;
分割出倾斜校正后的图片;
根据校验规则中的文件模板,获取位置信息,根据位置信息定位提取单个信息块图片。
5.根据权利要求1所述的核电文件校验处理方法,其特征在于,所述的对分割出来的信息块图片进行文字识别以提取图片结构化信息,包括:
对分割出来的单个信息块图片进行行、字切分得到单个文字图片;
通过对单个文字图片的统计特征进行分析,获取特征向量;
将所述特征向量输入人工神经网络以获取所述单个文字图片的文字信息。
6.一种核电文件校验处理系统,其特征在于,包括:
内容管理系统接口,用于从企业内容管理系统中获取非结构化核电文件及相关元数据信息;
校验规则获取模块,用于根据获取到的非结构化核电文件及相关元数据信息,基于预先录入的校验规则配置信息,获取校验规则;
图片结构化信息提取模块,用于基于所述校验规则,对所述非结构化核电文件进行图像分割,并对分割出来的信息块图片进行文字识别以提取图片结构化信息;
校验模块,用于结合所述图片结构化信息,进行文档数据校验。
7.根据权利要求6所述的核电文件校验处理系统,其特征在于,所述系统还包括:
预处理模块,用于对所述非结构化核电文件进行预处理后送往所述图片结构化信息提取模块进行处理;
其中,所述预处理包括:对所述非结构化核电文件先后进行灰度处理、二值化处理、滤波降噪处理以及图片倾斜矫正。
8.根据权利要求6所述的核电文件校验处理系统,其特征在于,所述系统还包括:
颜色信息提取模块,用于提取所述非结构化核电文件的颜色信息并送往所述校验模块;
文件属性提取模块,用于获取校验所需要的文件属性信息并送往所述校验模块;
清晰度识别模块,用于识别信息块图片的清晰度并送往所述校验模块;
所述校验模块具体用于基于所述校验规则,对提取出的所述图片结构化信息、清晰度信息、提取到的颜色信息文件以及获取到的文件属性信息进行综合校验,导出校验结果给结果显示用户接口,并提供各项校验结果的说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中广核工程设计有限公司;中广核工程有限公司;中国广核集团有限公司;中国广核电力股份有限公司,未经深圳中广核工程设计有限公司;中广核工程有限公司;中国广核集团有限公司;中国广核电力股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811122661.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的智能分析报告自动生成系统
- 下一篇:多媒体资源编辑方法及装置