[发明专利]一种手写公式的识别方法及计算设备有效
申请号: | 201810622746.4 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108898142B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 刘辉;郭龙;刘宁;徐行;张东祥;陈李江 | 申请(专利权)人: | 宁波云江互联网科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/26;G06V10/82;G06N3/04 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 殷晴青;赵爱军 |
地址: | 315000 浙江省宁波市高新区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 公式 识别 方法 计算 设备 | ||
1.一种手写公式的识别方法,适于在计算设备中执行,所述计算设备中存储有预先训练好的手写字符识别模型,所述方法包括:
获取待识别图像,并检测出所述待识别图像中的各连通域;
对检测出的每一个连通域,找出该连通域中最长的横线,判断该最长的横线是否为有效横线;
若该连通域中最长的横线为有效横线,则根据该有效横线确定该连通域对应的分式结构图像,包括:以该有效横线为左右界,将该有效横线上部的图像区域作为分子图像,下部的图像区域作为分母图像,将该分子图像、有效横线和分母图像组合形成相应的分式结构图像;
将该连通域对应的分式结构图像输入到所述手写字符识别模型中进行识别,以提取出该分式结构图像所包含的内容;
根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式,所述预设的判断规则为长分式规则、分式结构规则和字符个数规则中任一种;
其中,当预设的判断规则为长分式规则时,所述根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式的步骤包括:
判断该分式结构图像的宽度与有效字符连通域的平均高度的比值是否大于第二预定比例;
若大于,则确定该分式结构图像所包含的内容为手写分式;
其中,当预设的判断规则为分式结构规则时,所述根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式的步骤包括:
判断该分式结构图像所包含的内容是否含有预定字符;
若是,则确定该分式结构图像所包含的内容为手写分式;
其中,当预设的判断规则为字符个数规则时,所述根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式的步骤包括:
将该分式结构图像对应的分子图像和分母图像分别输入到所述手写字符识别模型中进行识别,以提取出该分子图像和分母图像所包含的内容;
根据该分式结构图像、分子图像和分母图像所包含的内容,确定该分式结构图像、分子图像和分母图像含有的数学字符个数;
若该分子图像和分母图像含有的数字字符个数之和大于该分式结构图像含有的数学字符个数,则确定该分式结构图像所包含的内容为手写分式。
2.如权利要求1所述的方法,其中,设某连通域所在位置的图像宽度为M、高度为N,则找出该连通域中最长的横线的步骤包括:
将连通域中的每个点标记为一个二维节点ai,j,i=1,2…,M,j=1,2…,N;
根据该连通域所在位置的图像建立横向有向图,其中若点ai,j为背景色节点,则其没有任何边,若其非背景色节点,则分别将其到点ai+1,j-1、点ai+1,j和点ai+1,j+1之间作为该横向有向图中的一条边;以及
采用预定算法找出到达点aM,j的最长路径,该最长路径所在线条即为该连通域中最长的横线。
3.如权利要求2所述的方法,其中,到达点aM,j的最长路径P(aM,j)=Max (P(aM-1,j-1)+w(aM-1,j-1,aM,j),P(aM-1,j+1)+w(aM-1,j+1,aM,j),P(aM-1,j)+w(aM-1,j,aM,j)),Max表示取最大值,w(ax,ay)表示有向边ax,ay的权值。
4.如权利要求2或3所述的方法,其中,所述预定算法为Dijkstra算法。
5.如权利要求1-3中任一项所述的方法,所述判断该最长的横线是否为有效横线的步骤包括:
获取该连通域的宽度;
判断该最长的横线与该连通域的宽度的比值是否大于第一预定比例;
若大于,则该最长的横线为有效横线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波云江互联网科技有限公司,未经宁波云江互联网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810622746.4/1.html,转载请声明来源钻瓜专利网。