[发明专利]一种图像的文本检测质量评价方法及系统在审
申请号: | 202011348987.8 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112287898A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 丛建亭;黄贤俊;侯进 | 申请(专利权)人: | 深源恒际科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 林聪源 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 检测 质量 评价 方法 系统 | ||
本发明公开了一种图像的文本检测质量评价方法及系统,包括:对图像进行文本检测和可视化绘制,得到文本检测行对象;筛选概率小于预设值的文本检测行对象,构成待评价对象集合;采用深度学习分类网络,依次对对象集合中每个文本检测行对象的可视化图像区域进行质量分类评价;其中,评价结果包括“可视化质量差”和“可视化质量良好”;输出“可视化质量差”的文本检测行对象,构成待质检修正对象集合。本发明采用了深度学习分类网络学习文本检测的可视化主观视觉质量,准确率高;相比仅用阈值逻辑区分方式更加符合人眼主观视觉感受,进一步提高票据文本检测标注过程中的处理效率,降低企业人力运营成本。
技术领域
本发明涉及文本检测质量评价技术领域,具体涉及一种图像的文本检测质量评价方法及系统,适用于票据等图像。
背景技术
文本检测:文本检测就是找出每个文本在图片中出现的位置,通常类别只有2个有文字和没文字。
质量评价:图像质量评价方法有主观评价和客观评价两个分支。主观评价以人作为观测者,对图像进行主观评价,力求能够真实地反映人的视觉感知;客观评价方法借助于某种数学模型,反映人眼的主观感知,给出基于数字计算的结果。
OCR(Optical Character Recognition光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。图像文字识别的解决方案通常是文本检测和文字识别两个步骤,文本检测用来定位图像中的文本行,文字识别则对文本行做进一步的识别,从而得到结构化得到文本信息。
2012年以来,深度学习在图片识别领域取得非常大的进步。相比传统的图片识别方法使用的色彩、HOG等低级视觉特征;深度神经网络能学得更多高级的、抽象的特征,这使得深度神经网络的性能远远超越传统方法。2014年以来,深度学习开始在物体检测、物体分割等领域取得优秀成果,涌现出Deeplab、YOLO、Faster RCNN等一序列方法,识别准确率在特定任务上已经超越了人类识别的水平,并在生成环境中得到大规模使用。
其中,文本检测现在多流行端到端的深度学习网络实现,包括训练环节和推理环节,通常情况下对文本检测训练后的模型做质量评价时通常采用有标注ground truth的方式评估模型的召回和准确率,从而获得模型的性能参数。对票据图像来说,票据中的文本行经常会特别丰富,有的票据多达几百个文本行目标,因此票据图像数据标注工作非常消耗人工成本,同时一个人完成一张票据图像修正也会消耗大量时间和精力,更容易使得人工疲劳。
虽然现在业内都会采用预标注文本检测框来改善票据图像数据标注效率,但为了获取高质量的文本检测训练数据,即使对单张票据图像的文本检测行做质检修正,由于目标数量很大,仍然是一个效率不够高的标注过程。
基于上述情况,为改善票据图像标注质检效率、节省人工标注成本、获取高质量文本检测训练图像数据,是非常有必要对无标注ground truth的票据图像的文本行做质量评价,标注时仅关注质量评价不高的文本行对象即可。
同时,通常文本检测对象的质量评价可以采用概率score设置阈值来实现,但概率具有一定的局限性,与人眼主观偏差较大;部分概率值偏小的图像从人眼主观视觉上判断也是质量良好的,即使其概率由于某些原因不如周围的文本对象。
发明内容
针对现有技术中存在的上述问题,本发明提供一种图像的文本检测质量评价方法及系统,其基于深度学习网络对单个文本行对象的可视化图像区域做出质量分类评价,分类结果包括“可视化质量差”和“可视化质量良好”两类,进一步提高改善疑似问题的文本行对象的人工质检修正效率。
本发明公开了一种图像的文本检测质量评价方法,包括:
对图像进行文本检测和可视化绘制,得到文本检测行对象;
筛选概率小于预设值的文本检测行对象,构成待评价对象集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深源恒际科技有限公司,未经深源恒际科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011348987.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:压缩阻力可调装置
- 下一篇:一种可以祛斑祛痘的沉香面膜
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序