[发明专利]一种基于Faster-RCNN对BI图标题检测的方法有效
申请号: | 202111146554.9 | 申请日: | 2021-09-28 |
公开(公告)号: | CN113807463B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 郝德浩;朱西华;雷坤东;孙力泽 | 申请(专利权)人: | 中电万维信息技术有限责任公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/25;G06F16/951;G06N3/0464;G06N3/08 |
代理公司: | 兰州嘉诺知识产权代理事务所(普通合伙) 62202 | 代理人: | 吴迪 |
地址: | 730000 甘肃省兰州市城关*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 faster rcnn bi 图标 检测 方法 | ||
本发明涉及计算机视觉与人工智能技术领域,特别是一种基于Faster‑RCNN对BI图标题检测的方法。所述方法步骤包括:a)BI图数据收集、标注规则定制与数据标注;b)数据预处理方面,数据增强方式的选取;c)框架选择与模型训练;d)推理端数据测试。本发明旨在输入一个BI图的前提下,不去文字全局检测,准确匹配BI图中的各级标题。职能识图融入文字检测和识别以大幅降低错误发生概率。
技术领域
本发明涉及计算机视觉与人工智能技术领域,特别是一种基于Faster-RCNN对BI图标题检测的方法。
背景技术
目标检测在过去的十几年中大致经历了两个历史时期:传统的目标检测和基于深度学习的目标检测。传统的目标检测算法大多是基于手工特征构建的。由于当时缺乏有效的图像表示,人们别无选择,只能设计复杂的特征表示,以及各种加速技术来用尽有限的计算资源。随着手工特征的性能趋于饱和,目标检测在2010年之后达到了一个饱和、稳定的水平。基于深度学习的目标检测的发展要追溯到2012年卷积神经网络的重生。由于深度卷积网络能够学习图像的鲁棒性和高层次特征表示,一个自然的问题是能否将其应用到目标检测中。R.Girshick等人在2014年率先打破僵局,提出了RCNN用于目标检测,从那时起,目标检测开始以前前所未有的速度发展。
在深度学习时代,目标检测可以分为两类:One-Stage Detection和Two-StageDetection,在学术界和工业界普遍认为,前者速度快精度较差,而后者精度高速度较慢。
随着互联网的发展,在大数据时代的背景下,数据可视化需求日益徒增,为加快可视化应用的开发,以及对数据分析的完美支撑,各大互联网公司相继开发了自己的大数据可视化平台,如:PowerBI、DataBI、QuickBI等。相比于传统图标和与数据仪表盘,如今的数据可视化致力于更生动、友好的形式,即时呈现隐藏在瞬息万变且庞杂数据背后的业务分析。无论在政务、环保、医疗、电力还是交通领域,通过交互式实时数据可视化应用来帮助业务人员快速利用分析展示数据,越来越成为大数据解决方案中的一环。
通用的文字检测模型都是基于图片全局文字信息进行检测,例如开源的工具:chineseocr、chineseocr-lite、PaddleOCR等,使用此方法可能会有以下缺陷:(1)可视化大屏图中的文字信息存在于图中的任何位置,其中,图表组件中的文字信息是需要根据数据源相应生成的,不需要人为去检测识别,另一方面,这部分信息在全局文字的占比很大,手动删除会影响配置BI图效率,进而影响用户体验;(2)可视化大屏图通常会有一些形状大小类似文字的图标,在通用检测模型中可能会被框出,影响文字识别结果。通用的文字检测模型由于训练数据的影响,训练的结果并不能适用当前Easy-BI数据综合开发工具的需求。
发明内容
本发明基于Easy-BI工具在配置效率上的需求,借鉴通用文字检测模型在全局文字上的识别,设计出一种对局部标题文字信息的检测模型,旨在方便在AI识图的时候方便用户配置标题信息。
一种基于Faster-RCNN对BI图标题检测的方法,包括如下步骤:
A、训练数据收集与标注
利用爬虫在相关网站收集BI图集,进行训练集和验证集划分,按训练集与验证集的比重为8:1配比,将目标数据分为三类,分为一级标题、二级标题和三级标题;一级标题为BI图的主标题,二级标题为BI图的分支标题,三级标题为BI图对应图表或文字的小标题;
B、改进Faster-RCNN算法模型
采用Two-Stage Detection模型中的Faster-RCNN作为Baseline,具体网络结构与改进如下:
B1、Backbone网络模型
Backbone采用ResNet-50,ResNet称为深度残差网络,50为网络层数;
B2、FPN结构
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电万维信息技术有限责任公司,未经中电万维信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111146554.9/2.html,转载请声明来源钻瓜专利网。