[发明专利]一种基于交付式的模板匹配信息提取方法在审
申请号: | 202111471829.6 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114140629A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 刘春刚;李佩钊 | 申请(专利权)人: | 上海云扩信息科技有限公司 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V20/62;G06V30/414 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 王艳 |
地址: | 200240 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交付 模板 匹配 信息 提取 方法 | ||
本发明公开了一种基于交付式的模板匹配信息提取方法,所述提取法包括以下步骤:S1、建立模板;S2、交付式模板匹配,指导巡店人员拍摄出合格的图像;S3、根据对应的模板,完成信息提取。该基于交付式的模板匹配信息提取方法,能够针对现场环境复杂、图片样式多样的结构化信息提取和录入。
技术领域
本发明涉及图像文本处理技术领域,具体为一种基于交付式的模板匹配信息提取方法。
背景技术
在零售领域,很多零售厂家都会有专门的巡店人员定期到各大零售商店获取相关的零售数据。当前很多厂商获取的方法是通过拍摄电脑屏幕上的数据,然后再人工录入各自的系统上面。这种方式效率不高,也给他们的工作带来了极大的不便。
随着AI技术的发展,目前的OCR技术已经能够顺利的识别出自然场景中的文字。但只是简单的把文字信息进行逐行的识别,并没有对识别出的信息进行结构化提取。
另一方面,由于巡店人员是使用手机拍摄。由于人员的操作不规范和现场条件的限制,拍摄的图像往往有很大的倾斜,这也给OCR识别的准确度带来了很大的影响。
因此,我们提出一种基于交付式的模板匹配信息提取方法,以便于解决上述中提出的问题。
发明内容
本发明的目的在于提供一种基于交付式的模板匹配信息提取方法,以解决上述背景技术提出的目前的OCR技术只是简单的把文字信息进行逐行的识别,并没有对识别出的信息进行结构化提取,同时由于人员的操作不规范和现场条件的限制,拍摄的图像往往有很大的倾斜,给OCR识别的准确度造成很大的影响的问题。
为解决上述问题,本发明提供如下技术方案:一种基于交付式的模板匹配信息提取方法,所述提取方法包括以下步骤:
S1、建立模板;
1)选择一张清晰和拍摄角度规范的图像作为模板;
2)调用OCR文字识别,识别出模板的文字信息;
3)选取模板的anchor字段,其中,anchor字段必须唯一;
4)选取需要识别的区域,并对该区域进行标识;
5)保持模板的信息;
S2、交付式模板匹配,指导巡店人员拍摄出合格的图像;
1)巡店人员进入门店,选取该门店对应的模板;
2)拍摄图像,并上传云端进行匹配计算;
3)如果匹配的分数大于阈值,拍摄合格,上传图像并保持,如果匹配分数小于阈值,则拍摄不合格,提醒巡店人员重新拍摄,重复上述步骤直到拍摄出合格的图像;
S3、根据对应的模板,完成信息提取;
1)对输入图像进行方向矫正,获得矫正图像R;
2)根据该图像对应的模板,进行OCR识别并模板匹配,获得模板匹配图像M;
3)对匹配图像M进行OCR重新识别,获得匹配图像M的相关文字信息;
4)加载该图像对应的模板信息,获得需要识别的区域,通过上一步骤识别的信息,提取出对应的结构化信息;
5)将提取的结构化信息录入数据库。
综上所述,S1中模板的信息包括anchor字段信息和识别区域信息。
与现有技术相比,本发明的有益效果是:该基于交付式的模板匹配信息提取方法,能够针对现场环境复杂、图片样式多样的结构化信息提取和录入。
附图说明
图1为本发明建立模板的处理流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海云扩信息科技有限公司,未经上海云扩信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111471829.6/2.html,转载请声明来源钻瓜专利网。