[发明专利]文件识别方法、装置有效
申请号: | 202110608537.6 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113326785B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 支晓繁;薛利;赵博;王砚溱;申震 | 申请(专利权)人: | 上海期货信息技术有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06V30/413;G06V30/14;G06V30/19;G06N20/00 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 金炜霞 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 识别 方法 装置 | ||
本发明提供一种文件识别方法和装置,包括:获取待识别文件、获取待识别文件第一预设位置的第一图文信息,根据第一图文信息与第一模板的锚点信息确定待识别文件对应第一模板,获取待识别文件在第二预设位置的第二图文信息,识别第二图文信息并与对应的预设属性以预设规则输出。本申请技术方案能够在识别待识别文件时充分利用模板的已知有效信息,提高识别效率和准确度。
技术领域
本发明涉及图像识别领域,特别涉及一种文件识别方法、装置、芯片和计算机可读存储介质。
背景技术
日常工作中存在大量文件,各个行业都需要对这些文件进行不定期、不定量的核查检验工作,例如银行需要对身份证、存款单进行核对以完成借贷、放款等业务;公司内部对纸质文件的检查和修订工作;政府机构则需要长期保存官方出具的证明文件以便日后审查等。
传统的文件核验方法通常是检查人员手动对比被校验文件,逐行逐字进行核对并寻找修正错误。该方法依赖于人工经验,不仅耗费人力成本,增加工作时间,极端情况下还可能导致较高的错误率。
发明内容
为了解决现有技术存在的问题,本发明的至少一个实施例提供了一种文件识别方法、装置、芯片和计算机可读存储介质,能够克服现有技术存在的缺陷,提高识别效率。
第一方面,本发明实施例提出一种文件识别方法,包括:
获取待识别文件;获取待识别文件第一预设位置的第一图文信息,第一预设位置为第一模板的锚点位置;根据第一图文信息与第一模板的锚点信息确定待识别文件对应第一模板,第一模板的锚点信息为第一模板在锚点位置的图文信息;获取第一模板对应的第二预设位置的第二图文信息,第二预设位置为与第一模板对应的待识别位置,且所述待识别位置与预设属性对应;识别第二预设位置的第二图文信息,并将识别出的第二图文信息和所述与其对应的预设属性以预设规则输出。
在一些实施例中,根据第一图文信息与第一模板的锚点信息确定待识别文件对应第一模板,包括:比对第一图文信息与第一模板的锚点信息;根据比对结果确定待识别文件对应第一模板。
在一些实施例中,第一模板的锚点信息为第一模板锚点图文的特征值,比对第一图文信息与第一模板的锚点信息,包括:获取第一图文信息的特征值;比对第一图文信息的特征值和第一模板锚点图文的特征值,确定两者特征值相似度;根据比对结果确定待识别文件对应第一模板,包括:根据特征值相似度确定待识别文件对应第一模板。
在一些实施例中,该文件识别方法,还包括:获取所述第一模板的文字特征,所述文字特征包括至少以下之一或组合:文字类型、字体等;识别所述第二预设位置的第二图文信息,具体包括:采用与所述文字特征对应的模型识别所述第二图文信息。
在一些实施例中,该文件识别方法,还包括:根据第一图文信息与第二模板的锚点信息确定待识别文件不对应第二模板,第二模板的锚点信息为第二模板在其锚点位置的锚点图文信息。
在一些实施例中,该文件识别方法,还包括:获取所述待识别文件的第三位置区域,所述第三位置区域为所述第一模板的印章位置区域;获取所述第三位置区域各像素点的RGB值;根据所述各像素点的RGB值确定所述像素点R、G、B各颜色通道数值、各像素点R、G、B颜色通道的平均值,以及,确定所述像素点的R、G、B颜色通道数值分别与所述平均值的偏离值;当所述像素点的所述平均值大于第一预设数值,或像素点R、G、B各颜色通道数值大于第三预设值,且R、G、B颜色通道中的至少一个的偏离值大于第二预设数值时,以白色像素点替换所述像素点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海期货信息技术有限公司,未经上海期货信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110608537.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理