[发明专利]一种基于多任务深度学习的票据文本检测方法有效
申请号: | 201911225976.8 | 申请日: | 2019-12-04 |
公开(公告)号: | CN111027443B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 刘桂雄;刘思洋 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/148;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 深度 学习 票据 文本 检测 方法 | ||
本发明提供一种基于多任务深度学习的票据文本检测方法,所述方法包括:构建多层卷积神经网络作为图像特征提取骨干网络,实现票据图像的特征提取;在卷积特征图上标注票据文本区域及区域中心线并训练,实现票据文本信息区域分割与文本中心线检测;在票据文本信息区域内通过滑动窗口方法沿着文本中心线前行,实现票据文本信息区域的单字符分割;依次对分割后的单个字符进行分类识别,形成完成票据文本信息。本发明利用深度学习强大的特征提取、归纳能力,提出采用端到端的多任务学习方法,实现票据文本区域分割、文本字符分割、文本字符识别,解决经典票据文本信息检测方法适用性不足、效率不高的问题。
技术领域
本发明涉及票据防伪鉴别领域,尤其涉及一种基于多任务深度学习的票据文本检测方法。
背景技术
视觉检测鉴别技术因准确性高、非接触、适用性好而得到广泛应用。票据图像文本信息具有文本信息区域繁多、汉字数字英文交叉混合等特点,目前票据图像文本信息多由人工进行读取,工作枯燥、重复性高,在疲劳工作下易由于精神不集中出现误读、漏读情况,研究机器代人的票据图像文本信息获取方法是该领域的研究重点。
近年来,随着电子硬件行业与信息行业迅速发展,计算机计算能力飞速提高,使大规模的图像计算与推理成为可能。基于深度学习的图像检测方法开始应用于图像文本信息获取领域并取得显著成效。基于深度学习的文本信息检测方法利用多层卷积运算对图像逐层提取图像特征,并进行特征运算、处理、归纳,通过文本信息区域定位、文本字符分割、文本字符分类识别等多任务组合,形成高效、泛用性强的文本信息读取方法。人工检测与传统图像分类方法在票据文本信息检测领域均有其短板,而基于深度学习的票据文本信息获取技术具有泛用性强、检测效率高的优势,将有助于提高金融行业数字化、智能化的发展与进步。
发明内容
为解决上述存在的问题与缺陷,本发明提供一种基于多任务深度学习的票据文本检测方法,将票据文本检测分为票据文本区域分割、票据文本字符分割、票据文本字符分类与识别三个任务,并统一于深度学习框架中,采用监督学习方法实现票据文本信息获取,解决目前票据文本信息获取中依赖人工等问题。
本发明的目的通过以下的技术方案来实现:
一种基于多任务深度学习的票据文本检测方法,该方法包括:
A构建多层卷积神经网络作为图像特征提取骨干网络,实现票据图像的特征提取;
B在卷积特征图上标注票据文本区域及区域中心线并训练,实现票据文本信息区域分割与文本中心线检测;
C在票据文本信息区域内通过滑动窗口方法沿着文本中心线前行,实现票据文本信息区域的单字符分割;
D依次对分割后的单个字符进行分类识别,形成完成票据文本信息。
本发明有益效果是:
利用深度学习在特征提取、归纳、推理的优势,将票据文本检测分为票据文本区域分割、票据文本字符分割、票据文本字符分类与识别三个任务,在大量标注数据支持下训练深度神经网络,实现票据文本信息的高效、准确检测与识别。
附图说明
图1是本发明所述的一种基于多任务深度学习的票据文本检测方法流程框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述。
本发明是一种基于多任务深度学习的票据文本检测方法,如图1所示,该方法包括如下步骤:
步骤10、构建多层卷积神经网络作为图像特征提取骨干网络,实现票据图像的特征提取:
在特征提取骨干网络的卷积层中引入空洞卷积,即对上一层卷积运算后的特征图进行双线性差值,扩大卷积特征图的分辨率,再进行本卷积层的卷积运算,在保证卷积核参数不变情况下,扩大卷积感受野,以得到更加丰富的票据图像特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911225976.8/2.html,转载请声明来源钻瓜专利网。