[发明专利]一种医疗单据识别方法和装置在审
申请号: | 201810271810.9 | 申请日: | 2018-03-29 |
公开(公告)号: | CN110321760A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 沈燕妮;潘多志;王如章 | 申请(专利权)人: | 北京和缓医疗科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06T5/30;G06T7/13 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了一种医疗单据识别方法,包括获取医疗单据图像,对医疗单据图像进行切割得到各个词块图像,根据各个词块图像所属类别,分别采用汉字识别模型和字符识别模型对汉字词块图像以及字符块图像进行识别,将汉字识别结果与字符识别结果逐行合并,对合并结果进行分词和标注,得到对应各分词结果的标注结果,可以根据标注结果获得识别结果。由于汉字识别模型可以对汉字进行针对性识别,字符识别模型可以对单个字符进行针对识别,如此可以保证医疗单据中汉字和字符的识别准确率,因而基于汉字识别结果和字符识别结果合并进行分词和标注,并根据标注结果所获得的识别结果也相应地具有较高的准确率。 | ||
搜索关键词: | 医疗单据 汉字识别 标注 块图像 字符识别结果 汉字 字符识别 图像 准确率 分词 合并 方法和装置 单个字符 分词结果 结果获得 字符块 逐行 切割 申请 保证 | ||
【主权项】:
1.一种医疗单据识别方法,其特征在于,所述方法包括:获取医疗单据图像,对所述医疗单据图像按照词块进行切割得到各个词块图像;对所述各个词块图像进行分类,得到所述各个词块图像的分类结果;若所述词块图像的分类结果为汉字类型,则将所述词块图像输入预先训练的汉字识别模型,得到汉字识别结果;若词块图像的分类结果为字符类型,则将所述词块图像切割得到字符块图像,并将所述字符块图像输入到预先训练的字符识别模型,得到字符识别结果;将所述汉字识别结果与所述字符识别结果逐行合并,对合并结果进行分词和标注,得到对应各分词结果的标注结果,根据所述标注结果获得所述医疗单据图像的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京和缓医疗科技有限公司,未经北京和缓医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810271810.9/,转载请声明来源钻瓜专利网。