[发明专利]一种基于脉冲主动学习的机打发票字符识别方法有效

专利信息
申请号: 202110741349.0 申请日: 2021-06-30
公开(公告)号: CN113553918B 公开(公告)日: 2023-09-26
发明(设计)人: 解修蕊;刘贵松;于蓓;黄鹂;丁浩伦;占求港 申请(专利权)人: 电子科技大学
主分类号: G06V30/412 分类号: G06V30/412;G06V30/14;G06V30/148;G06V30/19;G06V10/82;G06N3/0464;G06N3/045;G06N3/049;G06N3/084
代理公司: 成都弘毅天承知识产权代理有限公司 51230 代理人: 朱丹
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 脉冲 主动 学习 发票 字符 识别 方法
【说明书】:

发明公开了一种基于脉冲主动学习的机打发票字符识别方法,该方法包括构建可直接训练的深度脉冲神经网络模型ResNet‑18和CIFARNet,并且设计了脉冲主动学习的具体步骤。主动学习用于挑选出能够给模型提供更多信息量的有效样本,使得用最少的数据量训练模型并达到最好的效果。我们在识别机打发票的项目中对脉冲主动学习算法进行字符识别应用,将机打发票的文字部分进行提取,并将提取的中文、英文、数字进行单字分割,最后把分割好的单个字符样本输入模型训练,模型能够筛选信息量最大的样本,我们只对模型挑选出的样本做人工标记。

技术领域

本发明属于人工智能技术领域,涉及一种基于脉冲主动学习的机打发票字符识别方法。

背景技术

机打票据图像在日常生活中普遍存在。对于使用者来说,每天都有大量的票据信息采集和处理工作,传统的人手工录入信息效率低下且人力成本高昂;训练神经网络进行票据识别,需要对切割出的每一个字符人工标注,成本高昂且耗时。

在机器学习任务中,由于数据标注代价高昂,研究人员面临着如何以最少量的样本,来获得最有效学习模型的问题,针对这个问题,学术界提出了主动学习这一研究方向。主动学习针对具体任务制定“选择策略”,挑选出最有利于模型训练的样本让相关领域的专家进行标注,通过用这些“优选”的标记数据训练模型,达到在整体数据集上训练的效果。主动学习作为机器学习的一个分支,其主要是针对图像数据标签较少或为图像数据打标签代价较高这一场景而设计的。如果能够从脉冲神经网络的任务出发,针对脉冲神经网络特性和对任务的理解来制定标准,挑选有价值的样本,只针对部分图像数据进行标注,将大大减少脉冲神经网络监督学习的代价,降低模型训练过程中的信息交互负荷。

脉冲神经网络被誉为“第三代神经网络”,作为一种模拟生物神经元机制的神经网络,它判断累加的神经元膜电位是否达到阈值来决定是否发送信号,并通过发射、接收离散的脉冲信号在网络中传递信息。理论上,脉冲神经网络这种异步驱动机制在基于事件的现实场景中比第二代人工神经网络更具优势,能够为强人工智能提供更好的依托,但目前却没有得到很好的发展和应用。其中一个重要的原因是训练一个脉冲神经网络模型需要大量的标记数据,但目前缺乏针对脉冲神经网络的专门基准测试集较少,从真实场景中得到能够用于训练的图像数据再经过标注代价极高。

LIF模型是目前研究生物神经系统使用最广泛和最典型的模型之一,该模型对生物神经系统进行了高层次的抽象,忽略了树突相关的神经元空间结构和精确的离子活动机制。模型主要思想是:前神经元的突触接收到的脉冲会在轴突上经过一个低通滤波器转变为电流信号,通过电流来模拟神经元的膜电位,当膜电位达到设定的阈值θ时,前神经元发射一个动作电位经由其他神经元突触送往后神经元,同时对前神经元膜电位进行电位重置,并让它静止一小段时间再累计电压,该现象被称为膜的绝对不应期。突触前神经元在时间t的电位表示为:

其中,τm被称为细胞膜时间常数,它与膜电位的电容Cm和泄漏电阻Rm之间存在τ m=RmCm的关系,且二者均为常数。

正向传播时,脉冲响应函数定义为:其中x表示当前时刻膜电位,脉冲响应函数是Heaviside阶跃函数,当x≥0时设置为1,否则为0。反向传播时,梯度替代函数定义为:其中α用于控制函数的平滑程度。

目前,基于脉冲神经网络的深层训练模型与算法等已经取得了诸多阶段性成果。然而,现有方法主要借鉴了生物神经元的脉冲点火机制,而忽略了认知学习过程中的信息交互负荷以及标注代价等因素。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110741349.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code