[发明专利]文字识别矫正的方法在审
申请号: | 202011482957.6 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112507080A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 吕学强;游新冬;董志安 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/232;G06F40/166 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 矫正 方法 | ||
本申请公开了一种文字识别矫正的方法,包括:构建专业词库;构建识别结果区域矩阵;矫正。本申请的文字识别矫正的方法,通过引入语言模型,统计条件概率预测最佳符合词库的识别结果,通过检测项对应关系,进行前后矫正,进一步提高识别精确度,最后通过融合编辑距离和最长公共子序列的识别方法匹配最佳的识别结果,提高了识别准确率,能够很好地满足实际应用的需要。
技术领域
本申请涉及计算机视觉技术领域,具体涉及一种文字识别矫正的方法。
背景技术
近年来,随着深度学习和人工智能的不断发展与进步,计算机视觉领域成为热点研究方向,吸引了来自学术界与工业界的广泛关注。计算机视觉通过其对图像的强大的解读能力,为各行各业提供了技术支持。其中,医疗领域提出了智慧医疗的建设,并在近些年取得了突破性进展。化验检测对于就医患者必不可少,同时会产生大量的医疗化验单,极大的增加了医生的工作量。自2005年起,由Google不断维护的开源的Tesseract-OCR在文字识别领域取得优异的成绩,使整个学术界以及工业界掀起了一股人工智能的浪潮,各类文字识别算法应运而生。在医疗领域,OCR技术可以通过识别化验单文字,结合医疗信息系统,利用人工智能与大数据对化验单进行初步的解读,不仅能够使患者得到及时的就诊,同时也可以减轻工作人员的工作量,大大提升诊断效率。OCR全称Optical CharacterRecognition,中文翻译为光学字符识别。对于自然场景下化验单文字识别后处理,目前存在的后处理方法都存在一定的缺陷。例如:编辑距离算法对于较短序列或识别结果出现缺失、增加等情况效果并不理想;最长公共子序列算法可以克服文字的缺失或增添,但在多个序列拥有相同公共子序列时,矫正会出现争议;语言模型只是在预测时有多个预测结果,通过构建识别矩阵,找到最优的组合路径;等等。这些缺陷导致自然场景下化验单识别效果欠佳。
发明内容
本申请的目的是提供一种文字识别矫正的方法。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本申请实施例的一个方面,提供一种文字识别矫正的方法,包括:
构建专业词库;
构建识别结果区域矩阵;
矫正。
进一步地,所述矫正包括:
基于语言模型进行矫正;
基于编辑距离和最长公共子序列进行矫正;
基于对应关系进行矫正。
进一步地,基于语言模型进行矫正,包括:
语言模型通过概率分布来统计字符出现的概率,通过统计结果,计算最大的条件概率;第一个检测区域识别的结果S1,选取CRNN网络给出的前三个候选字,每个候选区域的概率W(S1)根据网络预测的概率重新归一化,第二个候选区域识别结果S2,选取CRNN网络给出的前三个候选字,每个候选区域的概率W(S2)根据网络预测的概率重新归一化,第二个候选区域识别结果S2,选取CRNN网络给出的前三个候选字,每个候选区域的概率W(S3)根据网络预测的概率重新归一化;
根据概率统计分析,条件概率P(S2|S1),即S1出现的情况下后面接S2的概率;
f=W(S1)P(S2|S1)W(S2)P(S3|S2)W(S3)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011482957.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种乙基纤维素中空微囊
- 下一篇:融合实体关键字特征的医疗领域实体分类方法