[发明专利]一种基于模型优化的OCR文件格式转化方法及系统有效
申请号: | 202110616887.7 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113065537B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 刘杰;张翔;宋永生 | 申请(专利权)人: | 江苏联著实业股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/34 |
代理公司: | 无锡苏元专利代理事务所(普通合伙) 32471 | 代理人: | 王清伟 |
地址: | 210006 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于模型优化的OCR文件格式转化方法及系统,获得第一图像,根据第一透视裁剪指令对第一图像进行初始透视裁剪,获得第二图像;根据第一坐标标识指令获得第一坐标标识结果;构建第一特征库,根据第一特征捕捉指令,基于第一特征库对第二图像进行特征遍历,获得第一输出结果;将第一坐标标识结果和第一输出结果输入坐标特征分析模型,获得第二输出结果;获得第一坐标文字识别结果;通过第一格式处理模块对第二输出结果和第一坐标文字识别结果进行处理,获得第一转化结果。解决了现有技术中存在对文档识别的过程中不能准确的识别文档段落格式,文字位置信息,进而导致识别结果与源文档存在格式出入的技术问题。 | ||
搜索关键词: | 一种 基于 模型 优化 ocr 文件格式 转化 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏联著实业股份有限公司,未经江苏联著实业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110616887.7/,转载请声明来源钻瓜专利网。
- 上一篇:杂多酸混合物及其应用
- 下一篇:一种应用于双向AC-DC变换器的电流采样电路