[发明专利]一种医疗单据识别方法和装置在审
申请号: | 201810271810.9 | 申请日: | 2018-03-29 |
公开(公告)号: | CN110321760A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 沈燕妮;潘多志;王如章 | 申请(专利权)人: | 北京和缓医疗科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06T5/30;G06T7/13 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗单据 汉字识别 标注 块图像 字符识别结果 汉字 字符识别 图像 准确率 分词 合并 方法和装置 单个字符 分词结果 结果获得 字符块 逐行 切割 申请 保证 | ||
本申请实施例公开了一种医疗单据识别方法,包括获取医疗单据图像,对医疗单据图像进行切割得到各个词块图像,根据各个词块图像所属类别,分别采用汉字识别模型和字符识别模型对汉字词块图像以及字符块图像进行识别,将汉字识别结果与字符识别结果逐行合并,对合并结果进行分词和标注,得到对应各分词结果的标注结果,可以根据标注结果获得识别结果。由于汉字识别模型可以对汉字进行针对性识别,字符识别模型可以对单个字符进行针对识别,如此可以保证医疗单据中汉字和字符的识别准确率,因而基于汉字识别结果和字符识别结果合并进行分词和标注,并根据标注结果所获得的识别结果也相应地具有较高的准确率。
技术领域
本申请涉及图像处理领域,尤其涉及一种医疗单据识别方法和装置。
背景技术
光学字符识别(Optical Character Recognition,OCR)是一种通过图像处理和模式识别对光学字符进行识别的技术,通过与图像输入设备如扫描仪等进行配合可以将图像信息转换为文本信息,从而实现文字自动录入。
目前,OCR技术发展日益成熟,已广泛应用于银行票据、车牌、名片、个人证件、报刊、档案等信息的识别。相比于传统的手工录入方式,OCR技术明显提高了人们对资料的存储和检索效率。
但是,OCR技术在医疗行业的应用还不够成熟,如对医疗单据等进行识别,还存在难以识别或识别不准确等问题。
发明内容
有鉴于此,本申请第一方面提供了一种医疗单据识别方法,所述方法包括:
获取医疗单据图像,对所述医疗单据图像按照词块进行切割得到各个词块图像;
对所述各个词块图像进行分类,得到所述各个词块图像的分类结果;
若所述词块图像的分类结果为汉字类型,则将所述词块图像输入预先训练的汉字识别模型,得到汉字识别结果;若词块图像的分类结果为字符类型,则将所述词块图像切割得到字符块图像,并将所述字符块图像输入到预先训练的字符识别模型,得到字符识别结果;
将所述汉字识别结果与所述字符识别结果逐行合并,对合并结果进行分词和标注,得到对应各分词结果的标注结果,根据所述标注结果获得所述医疗单据图像的识别结果。
可选的,所述对所述各个词块图像进行分类包括:
利用预先训练的分类模型对所述各个词块图像进行分类;所述分类模型为卷积神经网络模型。
可选的,所述分类模型通过如下方式训练得到:
获取第一训练样本;所述第一训练样本包括对医疗单据图像进行切割得到的词块图像和所述词块图像对应的第一真实标签;所述第一真实标签表征所述词块图像的类别;
将所述第一训练样本输入第一初始模型,得到所述第一初始模型对所述第一训练样本的第一预测标签;所述第一初始模型为卷积神经网络模型;
根据所述第一真实标签和所述第一预测标签更新所述第一初始模型的模型参数;
若更新后的第一初始模型满足第一预设条件,则将更新后的第一初始模型确定为分类模型。
可选的,所述根据所述第一真实标签和所述第一预测标签更新所述第一初始模型的模型参数包括:
根据所述第一真实标签和所述第一预测标签确定所述第一初始模型的损失函数;
根据所述损失函数更新所述第一初始模型的模型参数;
所述若更新后的第一初始模型满足预设条件,则将所述更新后的第一初始模型确定为分类模型包括:
若更新后的第一初始模型的损失函数最小,则将所述更新后的第一初始模型确定为分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京和缓医疗科技有限公司,未经北京和缓医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810271810.9/2.html,转载请声明来源钻瓜专利网。