[发明专利]基于图像处理与模式识别的折线图图像自动数字化方法有效

专利信息
申请号: 201910815122.9 申请日: 2019-08-30
公开(公告)号: CN110569774B 公开(公告)日: 2022-07-05
发明(设计)人: 韩波;柳庭瑜 申请(专利权)人: 武汉大学
主分类号: G06V30/413 分类号: G06V30/413;G06V30/146;G06V30/148;G06T5/00;G06T5/30;G06T7/13;G06T11/20
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 严彦
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图像 处理 模式识别 折线 自动 数字化 方法
【说明书】:

发明公开了一种基于图像处理与模式识别的折线图图像自动数字化方法,用于对折线图图像中彩色的折线进行自动识别,包括通过图像处理方式在折线统计图图像标记文本区域,识别文本区域中的数字;对所得识别结果进行过滤,得到正确的文本区域坐标值;计算坐标原点在图片坐标系中的坐标与对应数值;基于彩色通道数据过滤折线;计算折线点对应坐标,得出折线统计图图像的数字化结果。本发明综合采用图像处理和模式识别方法实现了折线图自动从图像转换为坐标数值的全自动技术方案,解决了从折线图图像中提取数据时进行手工标注、计算导致的低效率、低精度问题,大大提升了数据提取的效率和精度。

技术领域

本发明属于图像模式识别领域,涉及一种彩色线条的折线统计图图像的数字化方法,具体涉及一种基于图像处理与模式识别的折线图图像自动数字化方法。

背景技术

折线统计图是描绘统计事项总体指标动态、研究对象间依存关系以及各部分分配情况的统计图。然而,从各种新闻、报告、书籍等数据源获得的统计图一般已转换为图像形式,这给基于图像中的数据进行保存和后续分析带来了困难。因此,从折线统计图图像中提取数据是科研、产业界一个常见需求。但目前大多数情况下采用的是人眼观察、手工计算的方式进行数据提取,它比较费时、费力。如果有一种方法能自动从折线统计图图像中提取出数据,将大幅减少人力操作时间、提高数据精度。

当前人工智能尤其是深度神经网络技术在OCR(光学字符识别)模式识别领域取得了突破性进展,其技术原理是:利用海量标记的样本数据对深度神经网络进行训练,让神经网络自动优化从训练数据到识别目标的映射分布,从而建立深度神经网络模型,当一个新测试数据到来的时候,可以让这个模型负责计算从测试数据到识别目标的映射,从而达到准确识别印刷体文字和数字的效果。

因此,本发明拟综合利用数字图像处理技术和基于人工智能的数字光学字符识别技术,实现折线统计图图像的全自动数字化。

但是,类似于人工从折线统计图图像中提取数据的过程,自动从折线统计图图像中提取数据面临两个重要的问题:一是如何从线条中采样。在人工执行的一般过程中,往往采样极值点,这样就会造成曲线统计图的精度丢失,而如果采样频率过高又需要花费大量的时间和人工,因此存在着一定现实困难;二是确定坐标轴单位长度增量,这在人工执行的过程中需要测量与计算,精度较低。

关于数字化折线统计图,已有的最新国内外解决方案仍然还依赖一定的人工标点。比如一款名为GetData的软件提供了一种解决方案,但还是需要用户手工标定横轴、纵轴,标定单位长度,手工打点采样,才可以获得折线统计图的的数据。其存在使用不方便,精确度较低等局限性,其只是使用计算机完成了简单的数字计算过程,尚未提出具有实质进步的自动化技术方案。

发明内容

为了解决人工或现有解决方案从折线统计图图像中提取数据时的低效、低精度问题,本发明提供一种基于图像处理与模式识别的折线图图像自动数字化方法。

本发明所采用的技术方案是一种基于图像处理与模式识别的折线图图像自动数字化方法,用于对折线图图像中彩色的折线进行自动识别,包括以下步骤:

步骤1,在折线统计图图像标记文本区域;

步骤2,识别文本区域中的数字;

步骤3,对步骤2所得识别结果进行过滤,得到正确的坐标值;

步骤4,计算坐标原点在图片中的坐标与对应数值;

步骤5,基于彩色通道数据过滤折线;

步骤6,计算折线点对应坐标,得出折线统计图图像的数字化结果。

而且,步骤1的实现包括使用Sobel算子进行边缘检测,进行图像二值化,然后通过膨胀操作使图像中的高亮区域逐渐增长,通过腐蚀操作去除部分噪音,再次膨胀使得文本区域的面积扩大,之后再将面积较小的区域过滤,获得文本区域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910815122.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top