[发明专利]将纸质文件电子化著录归档的方法和系统有效
申请号: | 201811450185.0 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109598228B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 郝敬全;乔永华;马述杰;刘加波;柳宇刚 | 申请(专利权)人: | 泰华智慧产业集团股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F40/253;G06F40/30;G06F16/11 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 邓建国 |
地址: | 250101 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种将纸质文件电子化著录归档的方法和系统,涉及数字信息传输技术领域,方法包括:对纸质文件进行扫描;对电子文件进行校验;对识别标题、识别内容以及识别标题和识别内容的相对位置进行配置;形成识别内容配置库;形成语法语义检查规则;对电子文件进行预处理;识别预处理通过的电子文件的标题和内容,将预处理通过的电子文件的内容与识别内容配置库中的内容进行比对,均比对成功后,将预处理通过的电子文件的标题和内容进行关联;对预处理通过的电子文件的标题和内容进行语法语义检查;根据电子文件的类型制定著录策略;根据著录策略对电子文件进行著录归档。如此,缓解了日常繁重的纸质文件的归档和核对校验工作。 | ||
搜索关键词: | 纸质 文件 电子 著录 归档 方法 系统 | ||
【主权项】:
1.一种将纸质文件电子化著录归档的方法,其特征在于,包括:对纸质文件进行扫描,形成与所述纸质文件对应的电子文件,并将所述电子文件上传至文件校验模块;根据所述电子文件的图像信息、展示方向和尺寸对所述电子文件进行校验,并将校验通过的电子文件发送至版面内容识别模块;针对不同的所述电子文件对应的模板,对识别标题、识别内容以及所述识别标题和所述识别内容的相对位置进行配置;根据所述模板定义参考位置以及偏移量,计算出识别位置,并根据所述识别标题、识别内容、识别开始位置和结束位置形成识别内容配置库;分别建立与所述识别标题和所述识别内容对应的识别标题词库和识别内容词库,定义所述识别标题和所述识别内容的格式和长度,并根据定义的所述识别标题和所述识别内容的格式和长度将所述识别标题和所述识别内容进行关联,形成语法语义检查规则;对所述电子文件进行预处理;识别预处理通过的电子文件的标题和内容,根据所述预处理通过的电子文件的类型,从所述识别内容配置库中获取与所述识别内容库对应的识别标题和识别内容,将所述预处理通过的电子文件的标题与所述识别内容配置库中的标题进行比对,并将所述预处理通过的电子文件的内容与所述识别内容配置库中的内容进行比对,均比对成功后,将预处理通过的电子文件的标题和内容进行关联;根据所述语法语义检查规则,对预处理通过的电子文件的标题和内容进行语法语义检查;根据电子文件的类型制定著录策略;将通过语法语义检查的电子文件形成电子文件明细,根据所述著录策略对所述电子文件进行著录归档。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰华智慧产业集团股份有限公司,未经泰华智慧产业集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811450185.0/,转载请声明来源钻瓜专利网。