[发明专利]一种基于LSTM神经网络的医疗单据识别方法在审

专利信息
申请号: 201811589041.3 申请日: 2018-12-25
公开(公告)号: CN109784341A 公开(公告)日: 2019-05-21
发明(设计)人: 张宇;朱清清 申请(专利权)人: 华南理工大学
主分类号: G06K9/34 分类号: G06K9/34;G06N3/04;G06N3/08;G06Q40/08
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 冯炳辉
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 单据图像 医疗单据 预处理 识别和分类 单据识别 分类结果 容错能力 数字信号 特征向量 图像信号 字符特征 归一化 识别率 图像 分割 分类 转化
【权利要求书】:

1.一种基于LSTM神经网络的医疗单据识别方法,其特征在于,包括以下步骤:

1)单据图像预处理,将图像信号转化成数字信号;

2)分割字符,将单据图像归一化;

3)提取字符特征,生成特征向量;

4)单据识别与分类。

2.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于,在步骤1)中,单据图像预处理,将图像信号转化成数字信号,具体如下:

图像预处理包括滤波、倾斜校正和二值化,首先采用中值滤波的方法对图像进行滤波;然后采用基于方向投影的倾斜检测算法,用不同倾角的扫描线对图像进行扫描,计算出扫描线方向的最大投影;在所有的方向最大投影中再寻找最大值,取得最大方向投影的扫描线方向即为票据图像的倾角方向;最后采用自适应阈值法对图像进行二值化操作:把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个像素灰度设为灰度极小值,自适应阈值在每个像素点都不同,通过计算像素点周围区域加权平均,对区域所有像素进行平均加权,获取临界灰度值,最终得到二值化图像,将图像信号转化成数字信号。

3.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于,在步骤2)中,分割字符,将单据图像归一化,具体如下:

首先,对多字符目标进行水平投影,根据Y轴投影值将多字符目标分割成不同的行;再对同一行字符做垂直投影,根据X轴投影值,将其分割成多列;根据行、列值,分割出单个字符;对于垂直投影,具体做法是:以一条垂直线从左到右扫描一行字符,根据该垂直线在某位置是否遇到黑像素决定这一位置是否有字符,最后将分割的字符图像归一化为24*24的单一字符图像。

4.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于:在步骤3)中,提取字符特征,生成特征向量,具体如下:

采用粗网格特征提取方法,把独立的单个二值化字符纵横分割成由n个网格组成的形式,取每个网格中字符像素占总字符像素的比例,将所有比例值排成一列就形成n维特征向量;把归一化后的字符图像,纵向上分为20份,横向上分为12份,故20×12=240个1或0构成的列矩阵就作为字符的输入特征,这样对于每一个输入样本就要240个特征,即可确定输入层的节点数为240。

5.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于:在步骤4)中,单据识别与分类,具体如下:

定义一个LSTM模型,需要传入的参数是输入数据的维数为20,输入维数为240,层数为2,输出节点数即分类数目为10,隐藏节点数通过以下两个经验公式来确定,并根据实际情况做出调整:

其中,m为隐层节点数,n为输入层节点数,l为输出层节点数,α为1~10之间的常数;

LSTM神经网络分为输入层、隐含层和输出层;输入层负责接收信息,并传递给隐含层;隐含层负责信息变换,最后一个隐含层负责传递信息到输出层;输出层负责向外界输出信息处理结果;LSTM神经网络的学习过程包括正向传递和误差反向传播两个过程;数据经正向传递从输入层开始,经隐含层逐层计算,传到输出层,若输出层的实际输出和期望输出不符,则计算输出层的误差值,然后反向传播误差,也就是将输出误差以某种形式通过隐含层反传回输入层,并将误差分摊给各层所有神经元,从而获得各层神经元的误差,此误差作为修正该神经元参数的依据,最终识别出单据中的信息,包括药品名称和金额;

最后外接一个softmax分类器,取输出的最后一个部分传入分类器求出分类概率,最终得出单据的分类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811589041.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top