[发明专利]一种基于脉冲主动学习的机打发票字符识别方法有效
申请号: | 202110741349.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113553918B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 解修蕊;刘贵松;于蓓;黄鹂;丁浩伦;占求港 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/14;G06V30/148;G06V30/19;G06V10/82;G06N3/0464;G06N3/045;G06N3/049;G06N3/084 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 朱丹 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 脉冲 主动 学习 发票 字符 识别 方法 | ||
1.一种基于脉冲主动学习的机打发票字符识别方法,其特征在于:
步骤1:将机打发票的文字部分进行提取,并将提取的中文、英文、数字进行单字分割,最后把分割好的单个字符样本作为未标记训练集;
步骤2:基于LIF神经元构建可直接训练的脉冲神经网络模型;
步骤3:基于脉冲神经网络隐藏层输出的特征图构建脉冲主动损失预测模型;
步骤4:初始化模型参数,在未标记图像中随机筛选第一批数据交由人工标记,作为初始训练集,设置主动学习迭代轮数CYCLES和动态学习率初始值lr;
步骤5:将脉冲主动学习模型附加在目标脉冲神经网络模型上同时进行训练,构建可同时反传loss的损失函数;
步骤6:每轮主动学习迭代结束之后,将未标记字符集作为主动损失预测模型的测试集,得到每个数据的损失值进行排序,选出K个损失值最高的数据进行人工标注并加入训练集参与下一轮训练;
步骤7:当主动学习轮次小于CYCLES时,重复步骤5、6,利用变体的反向传播算法对深度脉冲神经元模型和主动损失预测模型进行训练,更新参数,直至主动学习轮次结束,完成训练;得到训练好的基于脉冲神经网络的图像分类模型;
步骤8:将待识别的发票字符数据集输入训练好的图像分类模型,进行字符识别,最后将识别结果拼接得到机打发票文字识别结果;
所述步骤3中,基于深度脉冲神经网络隐藏层输出的特征图构建脉冲主动损失预测模型的过程为:
脉冲主动损失预测模块的各个功能层,包含平均池化、全连接和LIFNode层,使得网络能够捕获脉冲神经网络模型隐藏层输出的特征图,从脉冲神经网络隐藏层抽取到的特征图能够同时具备时、空两个维度的信息;
脉冲信息在损失预测模块各个功能层间传递时同样需要点火机制来激活,最后经过各个功能层的处理得到一个标量的损失值,用于参与损失函数的计算;
所述步骤5中,将脉冲主动学习模型附加在目标分类脉冲神经网络模型上同时进行训练,构建可同时反传loss的损失函数;整体模型的损失函数定义为:
在脉冲神经网络目标模型上使用均方差作为损失函数,是脉冲神经网络目标分类任务的损失值,将其做为主动损失预测模块预测的真实值,而损失预测模块得到标量特征l的作为预测值,使用均方差作为损失函数对二者做最小化处理。
2.根据权利要求1所述的一种基于脉冲主动学习的机打发票字符识别方法,其特征在于:所述步骤2中,基于LIF神经元构建训练脉冲神经网络模型的过程为:
LIF神经元首先累积一段时间内前神经元发射的脉冲信号,神经元的突触接收到的脉冲会在轴突上经过一个低通滤波器转变为电流信号,该电流作为输入进入神经元内部,通过给电容器充电能够产生膜电位V(t),当膜电位达到预设的阈值θ时电容放电,神经元产生一个动作电位并进入绝对不应期,膜电位会在一小段时间后逐渐恢复为静息电位Vreset,然后重新启动泄漏整合的整个过程,膜电位V(t)为:
直接训练的脉冲神经网络在前向传播时,使用脉冲响应函数G(x)参与计算,该函数的输出是离散的0和1,而反向传播时,使用梯度替代函数δ(αx)的梯度来代替脉冲函数的梯度,其中α用于控制函数的平滑程度;脉冲响应函数G(x)为:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110741349.0/1.html,转载请声明来源钻瓜专利网。