[发明专利]商品信息图像识别系统有效
申请号: | 201910486364.8 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110210470B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 陈敦胜;李银胜 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19;G06V30/20;G06V30/412 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品信息 图像 识别 系统 | ||
本发明提供一种商品信息图像识别系统,用于对多类型的商品标签图像进行识别,并根据识别出的标签信息进行自动化的信息填写从而显示给用户查看,其特征在于,包括:商品模板存储部、标签图像获取部、图像预处理部、标签文本识别部、文本行修复处理部、模板检索判定部、识别控制部、关键字检索记录部、文本分类部、文本坐标获取部、数据信息匹配部、表格生成填写部、画面存储部以及输入显示部。
技术领域
本发明属于文本处理技术领域,具体涉及一种商品信息图像识别系统。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,文字处理软件进一步编辑加工的技术。OCR技术能够让机器看图识字,可以实现高效的信息录入、存储和检索。
OCR的应用场景,除了一些纯电子化的应用场景以外,大部分应用场景不仅要完成字符的正确识别,还需要将待识别证件中的文本内容以条目分类的方式展示给用户。因为识别结果仅仅是一长篇的文字,对用户来说没有意义,而是要将用户关心的内容进行提取,分门别类地呈现出来,从而便于用户校对。
目前,OCR所针对的版式都是比较固定的证件对象,例如身份证、行驶证、驾驶证等证件,只要识别出个别关键内容就能根据先验知识,对所有识别结果进行分类并对识别结果的合理性进行判定和修正,快速完成识别结果的结构化组织。
但是对非固定化的图像数据,例如口岸的商品标签,由于各个厂家的标签的格式、内容等信息千差万别,使得从标签中提取结构化的数据信息变得十分困难,流程复杂且错误率高。
发明内容
为解决上述问题,提供一种能够提取多类型的商品标签的数据信息、并且能够进行自动化填写的商品信息图像识别系统,本发明采用了如下技术方案:
本发明提供了一种商品信息图像识别系统,用于对多类型的商品标签图像进行识别并根据识别出的标签信息进行自动化的信息填写,其特征在于,包括:商品模板存储部、标签图像获取部、图像预处理部、标签文本识别部、文本行修复处理部、模板检索判定部、识别控制部、关键字检索记录部、文本分类部、文本坐标获取部、数据信息匹配部、表格生成填写部、画面存储部以及输入显示部,其中,商品模板存储部存储有多种商品识别信息以及与该商品识别信息相对应的关键字模板,该关键字模板包含名称关键字以及与名称关键字对应的单位信息,标签图像获取部获取商品标签图像以及相应的商品识别信息,图像预处理部对商品标签图像进行图像预处理从而得到预处理标签图像,标签文本识别部通过OCR技术对预处理标签图像进行字符识别从而得到多个包含标签信息的文本行以及相应的位置信息,文本行修复处理部根据位置信息将多个文本行中实际属于同一行的多行标签信息修复为同一行从而得到修复文本行,模板检索判定部根据商品识别信息对商品模板存储部进行检索从而判定商品标签图像是否具有相应的关键字模板,若模板检索判定部判定具有关键字模板,识别控制部就控制关键字检索记录部根据关键字模板依次对各行修复文本行中存在的名称关键字以及单位信息检索并记录检索到的名称关键字以及单位信息,控制文本分类部根据检索到的名称关键字以及单位信息将标签信息分类为相应的关键字文本、单位文本以及与单位信息对应的数据文本,控制文本坐标获取部获取与关键字文本、单位文本以及数据文本分别对应的位置信息作为文本坐标,并控制数据信息匹配部通过预设的数据匹配方法将修复文本行中的关键字文本、单位文本以及数据文本根据文本坐标进行对应匹配从而得到多个与名称关键字对应的数据结果信息,进一步控制表格生成填写部根据关键字模板生成相应的模板表格并将数据结果信息根据名称关键字填入模板表格从而得到标签信息表格,画面存储部存储有标签信息表格显示画面,输入显示部显示标签信息表格显示画面并在该画面中显示标签信息表格让用户确认。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910486364.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序