[发明专利]一种手写公式的识别方法及计算设备有效

专利信息
申请号: 201810622746.4 申请日: 2018-06-15
公开(公告)号: CN108898142B 公开(公告)日: 2022-03-18
发明(设计)人: 刘辉;郭龙;刘宁;徐行;张东祥;陈李江 申请(专利权)人: 宁波云江互联网科技有限公司
主分类号: G06V30/148 分类号: G06V30/148;G06V10/26;G06V10/82;G06N3/04
代理公司: 北京思睿峰知识产权代理有限公司 11396 代理人: 殷晴青;赵爱军
地址: 315000 浙江省宁波市高新区*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 手写 公式 识别 方法 计算 设备
【说明书】:

发明公开了一种手写公式的识别方法及计算设备,计算设备中存储有预先训练好的手写字符识别模型,该方法包括:获取待识别图像,并检测出待识别图像中的各连通域;对检测出的每一个连通域,找出该连通域中最长的横线,判断该最长的横线是否为有效横线;若该连通域中最长的横线为有效横线,则根据该有效横线确定该连通域对应的分式结构图像;将该连通域对应的分式结构图像输入到手写字符识别模型中进行识别,以提取出该分式结构图像所包含的内容;根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式。

技术领域

本发明涉及图像处理技术领域,特别涉及一种手写公式的识别方法及计算设备。

背景技术

随着计算机和互联网技术的发展,人们越来越多的使用自动化设备对学生考试试卷进行阅卷。在试卷分析时,经常需要对手写字体进行识别,特别是对于如数学、物理等理工科目来说,手写字体中还存在有大量的手写公式,而手写公式比较随意,文字之间连笔、断笔的情况很多,文字与文字之间互相粘连,文字的大小、上下左右的对齐都不规律,公式的结构包括上下、左右及嵌套等,非常复杂。

目前,对于写公式进行识别的方式主要有两种:第一种是基于传统的公式切割后再识别,这种方式主要是对公式结构进行图像处理以及规则检测,再进行字符切割和识别,对于长公式结构检测很准确,但对连笔和字符粘连情况,很难切割识别,另外基于规则的公式检测,因为手写公式的随意性,规则并不总是有效,对于短公式结构会产生一些误检和漏检;第二种是基于端到端的手写字符识别深度学习方法,这种方法对于连笔、字符粘连以及基本的从左到右书写的字符,识别准确度都很高,但对于复杂公式来说,例如长分式结构,具有分子、分母的上下结构,分子和分母结构也比较复杂,或分式里面再嵌入分式这种复杂数学公式,识别效果很差。因此,需要提供一种新的手写公式的识别方法来优化上述处理过程。

发明内容

为此,本发明提供一种手写公式的识别方案,以力图解决或者至少缓解上面存在的问题。

根据本发明的一个方面,提供一种手写公式的识别方法,适于在计算设备中执行,该计算设备中存储有预先训练好的手写字符识别模型,该方法包括如下步骤:首先,获取待识别图像,并检测出待识别图像中的各连通域;对检测出的每一个连通域,找出该连通域中最长的横线,判断该最长的横线是否为有效横线;若该连通域中最长的横线为有效横线,则根据该有效横线确定该连通域对应的分式结构图像;将该连通域对应的分式结构图像输入到手写字符识别模型中进行识别,以提取出该分式结构图像所包含的内容;根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式。

可选地,在根据本发明的手写公式的识别方法中,设某连通域所在位置的图像宽度为M、高度为N,则找出该连通域中最长的横线的步骤包括:将连通域中的每个点标记为一个二维节点ai,j,i=1,2…,M,j=1,2…,N;根据该连通域所在位置的图像建立横向有向图,其中若点ai,j为背景色节点,则其没有任何边,若其非背景色节点,则分别将其到点ai+1,j-1、点ai+1,j和点ai+1,j+1之间作为该横向有向图中的一条边;以及采用预定算法找出到达点aM,j的最长路径,该最长路径所在线条即为该连通域中最长的横线。

可选地,在根据本发明的手写公式的识别方法中,到达点aM,j的最长路径P(aM,j)=Max(P(aM-1,j-1)+w(aM-1,j-1,aM,j),P(aM-1,j+1)+w(aM-1,j+1,aM,j),P(aM-1,j)+w(aM-1,j,aM,j)),Max表示取最大值,w(ax,ay)表示有向边ax,ay的权值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波云江互联网科技有限公司,未经宁波云江互联网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810622746.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top