[发明专利]一种纸质合同防篡改校验方法及系统有效
申请号: | 202010536424.5 | 申请日: | 2020-06-12 |
公开(公告)号: | CN112784220B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 胡为民;郑喜 | 申请(专利权)人: | 深圳市迪博企业风险管理技术有限公司 |
主分类号: | G06F21/10 | 分类号: | G06F21/10;G06F40/194;G06F40/279;G06K9/00;G06Q50/18 |
代理公司: | 深圳余梅专利代理事务所(特殊普通合伙) 44519 | 代理人: | 高真辉 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纸质 合同 篡改 校验 方法 系统 | ||
1.一种纸质合同防篡改校验方法,其特征在于,该方法基于一系统实现,所述系统包括有录入单元(1)、OCR识别单元(2)、存储单元(3)、读取单元(4)和校验单元(5),所述方法包括如下步骤:
步骤S1,将所述纸质合同的原始电子文档保存于所述存储单元(3);
步骤S2,获取所述纸质合同的扫描件;
步骤S3,所述OCR识别单元(2)利用OCR识别技术对所述扫描件进行文字识别,将识别得到的文字信息保存为目标文件;
步骤S4,所述读取单元(4)向所述存储单元(3)获取原始电子文档,然后读取所述原始电子文档的文字信息并保存为参照文件;
步骤S5,所述校验单元(5)对所述目标文件与所述参照文件中的文字信息进行逐行比较,对所述目标文件中与所述参照文件不同的文字进行标示;
所述步骤S3中,首先构建一个总列表listIn和一个段落列表listPara,所述OCR识别单元(2)对所述扫描件进行文字识别的过程包括:
步骤S30,将所述OCR识别单元(2)识别的每行文字信息按照预设顺序写入所述总列表listIn中;
步骤S31,将当前行作为新段落的开始行,写入所述段落列表listPara中;
步骤S32,读取下一行进行判断处理:
步骤S320,判断当前行高与上一行高之差是否达到预设的行高阈值,若是,则表示字体大小发生变化,上一段落已结束,将当前行作为新段落的第一行,然后执行步骤S33;若否,则执行步骤S321;
步骤S321,判断当前行缩进是否超过两个字段,若是,则表示上一段落已经结束,将当前行记为新段落的第一行,然后执行步骤S33;若否,则执行步骤S322;
步骤S322,判断当前行的终止位置坐标是否大于上一行终止位置坐标两个字符,若是,则表示上一段落已经结束,当前行记为新段落的第一行,然后执行步骤S33;若否,则执行步骤S323;
步骤S323,判断当前行终止位置坐标是否小于上一行终止位置坐标两个字符,若是,则表示当前行为段落结束行,先将当前行写入所述段落列表listPara中,然后调取下一行作为当前行,并执行步骤S33;若否,则执行步骤S34;
步骤S33,将所述段落列表listPara中的内容合并后作为段落写入预设的输出列表listOut中,同时清空所述段落列表listPara,返回至所述步骤S31;
步骤S34,若所述步骤S320、所述步骤S321、所述步骤S322和所述步骤S323的判断结果皆为否,说明当前行是段落中的一行,将当前行直接写入所述段落列表listPara中,然后调取下一行作为当前行,返回至所述步骤S32;
循环执行所述步骤S31至步骤S34,直至所述总列表listIn中的全部文本行识别完成,将所述输出列表listOut的输出结果保存为目标文件。
2.如权利要求1所述的纸质合同防篡改校验方法,其特征在于,所述文字信息包括行标志、行宽度标志、行高度标志、页标志以及文字内容。
3.如权利要求1所述的纸质合同防篡改校验方法,其特征在于,所述步骤S1中,所述原始电子文档的格式为WORD格式或者PDF格式。
4.如权利要求1所述的纸质合同防篡改校验方法,其特征在于,所述步骤S2中,所述扫描件通过扫描仪对所述纸质合同进行扫描后得到,或者对所述纸质合同拍照合并形成PDF格式文件后得到。
5.如权利要求1所述的纸质合同防篡改校验方法,其特征在于,所述步骤S4中,所述读取单元(4)基于PDFBOX、iText或者POI文档处理技术向所述存储单元(3)获取原始电子文档。
6.如权利要求1所述的纸质合同防篡改校验方法,其特征在于,所述步骤S5中,所述校验单元(5)利用预设的diff-utils工具对所述目标文件与所述参照文件中的文字信息进行逐行比较,根据所述diff-utils工具输出的比较结果生成文档差异表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市迪博企业风险管理技术有限公司,未经深圳市迪博企业风险管理技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010536424.5/1.html,转载请声明来源钻瓜专利网。