[发明专利]合同影像图片的识别方法、电子装置及可读存储介质有效
申请号: | 201810343634.5 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108830133B | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 郑佳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/54 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 于志光;郭梦霞 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合同 影像 图片 识别 方法 电子 装置 可读 存储 介质 | ||
本发明涉及一种合同影像图片的识别方法、电子装置及可读存储介质,该方法包括:收到待识别的合同影像图片后,对待识别的合同影像图片进行预设的去躁处理;按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓,并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓;对合同影像图片中红章轮廓内的图片进行白平衡处理,并去除红色分量;对去除红色分量后的合同影像图片进行OCR识别。本发明能够较好的支持合同影像图片中红章部分的准确识别,从而提高对非纯文字类型合同的OCR识别适应性,有效地提高合同影像图片的识别率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种合同影像图片的识别方法、电子装置及可读存储介质。
背景技术
在现有金融领域中,经常需要对合同影像图片进行识别以将合同影像图片中的信息进行提取并进行其中的内容分析。现有的合同影像图片识别方案一般都是基于传统的OCR识别技术对原始的合同影像图片直接进行识别,对非纯文字类型合同适应性较差,识别率较低。
发明内容
本发明的目的在于提供一种合同影像图片的识别方法、电子装置及可读存储介质,旨在提高合同影像图片的识别率。
为实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的合同影像图片的识别系统,所述合同影像图片的识别系统被所述处理器执行时实现如下步骤:
收到待识别的合同影像图片后,对待识别的合同影像图片进行预设的去躁处理;
按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓,并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓;
对合同影像图片中红章轮廓内的图片进行白平衡处理,并去除红色分量;
对去除红色分量后的合同影像图片进行OCR识别。
优选地,所述按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓,并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括:
检测经去躁处理后的合同影像图片中的RGB红色分量集中区域;
提取出RGB红色分量集中区域图像并对提取出的RGB红色分量集中区域图像进行边缘检测,得到二值化的边缘轮廓图;
将二值化的边缘轮廓图上的点坐标存入预设数组;
计算所述RGB红色分量集中区域图像上的每一点与所述预设数组中点的距离,得到所述RGB红色分量集中区域图像上的每一点距离所述预设数组中点的最大距离,找出各个最大距离中的最小值,将所述最小值对应的所述RGB红色分量集中区域图像上的点作为椭圆中心,找出各个最大距离中的最大值,将所述最大值作为椭圆长轴长度;
基于所述椭圆中心、所述椭圆长轴长度和所述预设数组建立椭圆轮廓,并将建立的椭圆轮廓作为合同影像图片中的红章轮廓。
优选地,所述基于所述椭圆中心、所述椭圆长轴长度和所述预设数组构造椭圆轮廓,并将构造出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括:
将椭圆中心坐标(P,Q),椭圆长轴长度a,及预设数组中每一点的坐标(x,y)代入如下椭圆方程:
求得参数b、θ的值,在预设的二维参数空间上对参数b、θ的值进行统计,得到参数b、θ的统计值,将统计值的最大值超过预设阈值的一组参数b、θ作为椭圆轮廓参数,根据所述椭圆轮廓参数来建立椭圆轮廓,并将建立的椭圆轮廓作为合同影像图片中的红章轮廓。
优选地,在所述对去除红色分量后的合同影像图片进行OCR识别的步骤之前,所述处理器还用于执行所述合同影像图片的识别系统,以实现以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343634.5/2.html,转载请声明来源钻瓜专利网。