[发明专利]公式识别方法和装置有效
申请号: | 201510064672.3 | 申请日: | 2015-02-06 |
公开(公告)号: | CN104636741B | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 吴仑;王岩;梁爽;陈恭明;邹静 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/54 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种公式识别方法和装置,该公式识别方法包括对图像版面进行扭曲矫正;对矫正后的图像版面中的基本元素进行分割,根据所述图像版面中基本元素的特征确定所述基本元素所在区域为公式区域;根据公式符号对所述公式区域进行公式识别。本发明可以实现利用短文本图像中的多种局部特性,对短文本图像中的公式进行检测和识别,可以有效地提高短文本图像中的有效信息,减少乱码的出现,进而可以提高整个答题系统的准确率。 | ||
搜索关键词: | 公式 识别 方法 装置 | ||
【主权项】:
一种公式识别方法,其特征在于,包括:对图像版面进行扭曲矫正;对矫正后的图像版面中的基本元素进行分割,根据所述图像版面中基本元素的特征确定所述基本元素所在区域为公式区域;根据公式符号对所述公式区域进行公式识别;其中,所述对图像版面进行扭曲矫正包括:获得图像版面中文本行的中心线,在所述图像版面中每一基本元素的位置上对所述文本行的中心线进行微调,以使所述文本行的中心线逼近直线,完成对所述图像版面的扭曲矫正;所述获得图像版面中文本行的中心线包括:将所述图像版面在垂直方向上平均划分为至少两列;对每一列在水平方向上进行投影,统计每一列在水平方向上的投影密度,生成每一列的密度分布函数,并获得每一列的密度分布函数的极大值点;按照预定的顺序,对于相邻的两列,计算左边列的每个极大值点与右边列的每个极大值点的第一差值,以及计算右边列的每个极大值点与左边列的每个极大值点的第二差值;获得第一极大值点的第一差值与第一极大值点的第二差值,所述第一极大值点的第一差值为所述左边列的第一极大值点与所述右边列的第一极大值点的差值,所述第一极大值点的第二差值为所述右边列的第一极大值点与所述左边列的第一极大值点的差值;如果所述第一极大值点的第一差值与所述第一极大值点的第二差值之差的绝对值小于或等于第一阈值,则确定所述左边列的第一极大值点与所述右边列的第一极大值点在同一行内,连接所述左边列的第一极大值点与所述右边列的第一极大值点;依次连接所述至少两列中位于同一行内的极大值点,获得所述图像版面中文本行的中心线。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510064672.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种号牌识别的方法及装置
- 下一篇:测量数据电子化装置和测量数据电子化方法