[发明专利]一种基于卷积神经网络的复杂档案图像倾斜矫正方法有效
申请号: | 201910449636.7 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110211048B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 徐文渊;魏馨霆;桂宁;康宇哲 | 申请(专利权)人: | 国家电网有限公司;湖北华中电力科技开发有限责任公司;桂宁;康宇哲 |
主分类号: | G06T3/60 | 分类号: | G06T3/60 |
代理公司: | 武汉楚天专利事务所 42113 | 代理人: | 孔敏 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于卷积神经网络的复杂档案图像倾斜矫正方法,首先选取大量档案样本进行训练,构建文本行定位模型,通过该模型对复杂文档的文本行进行分割,再通过计算文本行的倾斜角度,根据倾斜角度对文档主体进行整体倾斜校正,本发明使用对象定位得到的文本行代替档案图像整体进行倾角检测有效降低了复杂版面因素对倾角计算精度的影响,提高了倾斜校正系统的开发效率、倾斜校正准确率和算法的普适性。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 复杂 档案 图像 倾斜 矫正 方法 | ||
【主权项】:
1.一种基于卷积神经网络的复杂档案图像倾斜矫正方法,其特征在于包括如下步骤:步骤一、筛选一定数量的具有代表性的档案样本,包括含有表格、盖章、页眉页脚、插图的图像样本和普通档案样本制作成数据集;步骤二、设计卷积神经网络模型,使用所述数据集对设计好的卷积神经网络模型进行迭代训练得到模型权重,对训练得到的模型权重进行精确度和可靠性评估得到最优化模型权重;步骤三、加载所述最优化模型权重对测试文档图像进行预测,获得多个文本行对象区域以及对应的置信度;步骤四、对步骤三得到的文本行对象进行筛选,得到整篇文档图像中最长、最突出的文本行,对该文本行对象区域内的子图像进行单独阈值分割并生成各子图像的拟合点,删除误差大的拟合点,对筛选过后的拟合点进行直线拟合,所得直线的倾角即为整体档案图像的倾斜角度;步骤五、使用步骤四所得倾斜角度对档案图像进行整体倾斜校正即得到处理后的图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;湖北华中电力科技开发有限责任公司;桂宁;康宇哲,未经国家电网有限公司;湖北华中电力科技开发有限责任公司;桂宁;康宇哲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910449636.7/,转载请声明来源钻瓜专利网。