[发明专利]一种基于LSTM神经网络的医疗单据识别方法在审
申请号: | 201811589041.3 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109784341A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张宇;朱清清 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08;G06Q40/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 单据图像 医疗单据 预处理 识别和分类 单据识别 分类结果 容错能力 数字信号 特征向量 图像信号 字符特征 归一化 识别率 图像 分割 分类 转化 | ||
1.一种基于LSTM神经网络的医疗单据识别方法,其特征在于,包括以下步骤:
1)单据图像预处理,将图像信号转化成数字信号;
2)分割字符,将单据图像归一化;
3)提取字符特征,生成特征向量;
4)单据识别与分类。
2.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于,在步骤1)中,单据图像预处理,将图像信号转化成数字信号,具体如下:
图像预处理包括滤波、倾斜校正和二值化,首先采用中值滤波的方法对图像进行滤波;然后采用基于方向投影的倾斜检测算法,用不同倾角的扫描线对图像进行扫描,计算出扫描线方向的最大投影;在所有的方向最大投影中再寻找最大值,取得最大方向投影的扫描线方向即为票据图像的倾角方向;最后采用自适应阈值法对图像进行二值化操作:把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个像素灰度设为灰度极小值,自适应阈值在每个像素点都不同,通过计算像素点周围区域加权平均,对区域所有像素进行平均加权,获取临界灰度值,最终得到二值化图像,将图像信号转化成数字信号。
3.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于,在步骤2)中,分割字符,将单据图像归一化,具体如下:
首先,对多字符目标进行水平投影,根据Y轴投影值将多字符目标分割成不同的行;再对同一行字符做垂直投影,根据X轴投影值,将其分割成多列;根据行、列值,分割出单个字符;对于垂直投影,具体做法是:以一条垂直线从左到右扫描一行字符,根据该垂直线在某位置是否遇到黑像素决定这一位置是否有字符,最后将分割的字符图像归一化为24*24的单一字符图像。
4.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于:在步骤3)中,提取字符特征,生成特征向量,具体如下:
采用粗网格特征提取方法,把独立的单个二值化字符纵横分割成由n个网格组成的形式,取每个网格中字符像素占总字符像素的比例,将所有比例值排成一列就形成n维特征向量;把归一化后的字符图像,纵向上分为20份,横向上分为12份,故20×12=240个1或0构成的列矩阵就作为字符的输入特征,这样对于每一个输入样本就要240个特征,即可确定输入层的节点数为240。
5.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于:在步骤4)中,单据识别与分类,具体如下:
定义一个LSTM模型,需要传入的参数是输入数据的维数为20,输入维数为240,层数为2,输出节点数即分类数目为10,隐藏节点数通过以下两个经验公式来确定,并根据实际情况做出调整:
其中,m为隐层节点数,n为输入层节点数,l为输出层节点数,α为1~10之间的常数;
LSTM神经网络分为输入层、隐含层和输出层;输入层负责接收信息,并传递给隐含层;隐含层负责信息变换,最后一个隐含层负责传递信息到输出层;输出层负责向外界输出信息处理结果;LSTM神经网络的学习过程包括正向传递和误差反向传播两个过程;数据经正向传递从输入层开始,经隐含层逐层计算,传到输出层,若输出层的实际输出和期望输出不符,则计算输出层的误差值,然后反向传播误差,也就是将输出误差以某种形式通过隐含层反传回输入层,并将误差分摊给各层所有神经元,从而获得各层神经元的误差,此误差作为修正该神经元参数的依据,最终识别出单据中的信息,包括药品名称和金额;
最后外接一个softmax分类器,取输出的最后一个部分传入分类器求出分类概率,最终得出单据的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811589041.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌识别方法及装置
- 下一篇:一种基于深度学习模型的OCR识别方法及终端