[发明专利]一种识别证件的方法和装置在审
申请号: | 202110279229.3 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113011426A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 杨勇;马倩;洪学海 | 申请(专利权)人: | 上饶市中科院云计算中心大数据研究院 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/20;G06K9/40;G06K9/46 |
代理公司: | 北京科家知识产权代理事务所(普通合伙) 11427 | 代理人: | 张勋 |
地址: | 334000 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 证件 方法 装置 | ||
本申请实施例公开了一种识别证件的方法和装置,其中方法包括步骤:确认目标图像与模板图像属于同一类证件图像;在所述模板图像中截取区域子模板图像,将所述区域子模板与目标图像进行匹配达到查找目标图像中相应的区域,根据位置偏移参数截取目标图像中待识别区域图像;对所述待识别区域图像进行光学识别并提取文本信息。本申请实施例提供的识别证件的方法,该方法只需要少量或极少量的模板图像,且无需训练,识别速度快、准确率高。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种识别证件的方法和装置。
背景技术
随着互联网技术的高速发展,越来越多的应用场景需要利用图像中的文本信息,尤其是读取证件中的文本信息。目前,流行的证件文本信息提取方法为基于深度学习的光学字符识别(Optical Character Recognition,OCR)技术,该技术具有准确率高、识别信息量大等优点,然而基于深度学习的OCR识别技术需要大量证件图像做训练,同时训练过程耗费大量人力、物力,有些甚至用速度换精度,速度超过10s以上。
计算机文字识别,俗称光学字符识别(Optical Character Recogn ition,OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。OCR技术是实现文字高速录入的一项关键技术。Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。数年以后,HP将Tesseract贡献给开源软件业,让其重焕新生,直至2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。Tesseract目前已作为开源项目发布在Google Project,其最新版本3.0已经支持中文OCR,并提供了一个命令行工具。
发明内容
本申请的目的在于提供一种识别证件的方法,该方法只需要少量或极少量的模板图像,且无需训练,识别速度快、准确率高。
本申请提供的一种识别证件的方法,包括步骤:首先,确认目标图像与模板图像属于同一类证件图像;接着,在所述模板图像中截取区域子模板图像,将所述区域子模板与目标图像进行匹配达到查找目标图像中相应的区域,根据位置偏移参数截取目标图像中待识别区域图像;最后,对所述待识别区域图像进行光学识别并提取文本信息。
一种可选的实施方式中,所述确认目标图像与模板图像属于同一类证件图像包括步骤:采用SIFT特征点检测分析图像,然后基于FLANN的匹配器定位图片,来达到对比目标图像是否与模板图像属于同一类证件,如果是同一类证件图像则进入下一步处理,否则提示用户重新上传图片。
一种可选的实施方式中,所述确认目标图像与模板图像属于同一类证件图像之后还包括步骤:对目标图像进行图像预处理,包括但不限于图像矫正、图像归一化、直方图处理和灰度处理。
一种可选的实施方式中,通过flash服务器通过http请求接收所述目标图像。
一种可选的实施方式中,所述对所述待识别区域图像进行光学识别并提取文本信息之前还包括步骤:对待识别区域图像进行非局部平均去噪处理;进行固定阈值二值化处理;查找检测物体轮廓,并描边、绘制出图像轮廓;根据待识别文本长度过滤图像;使用Tesseract-OCR对待识别区域图像进行文本识别,完成文本信息的提取并返回给用户。
第二方面,本申请实施例还提供了一种识别证件的装置,该装置具体包括:
校验单元,用于确认目标图像与模板图像属于同一类证件图像;
截取单元,用于在所述模板图像中截取区域子模板图像,将所述区域子模板与目标图像进行匹配达到查找目标图像中相应的区域,根据位置偏移参数截取目标图像中待识别区域图像;
识别单元,用于对所述待识别区域图像进行光学识别并提取文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上饶市中科院云计算中心大数据研究院,未经上饶市中科院云计算中心大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110279229.3/2.html,转载请声明来源钻瓜专利网。