[发明专利]包括经历OCR处理的文本的图像的分辨率调整有效
申请号: | 201180012992.4 | 申请日: | 2011-03-07 |
公开(公告)号: | CN102782705A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | D.尼耶姆塞维奇;M.乌德利亚;B.德雷塞维奇 | 申请(专利权)人: | 微软公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K19/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李静岚;汪扬 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 经历 ocr 处理 文本 图像 分辨率 调整 | ||
1. 一种提取表征图像中的文本行的信息的系统,其包含:
输入组件,用于接收包括文本行的输入图像的位图;以及
参数化引擎,用于通过找出使吻合函数最大的参数曲线为图像中的至少一个文本行确定基线,该吻合函数取决于参数曲线通过的像素和在参数曲线下面的像素的数值,其中该基线对应于使吻合函数最大的参数曲线。
2. 如权利要求1所述的系统,其中该参数化引擎被配置成将吻合函数定义成fitness(baseline),并等于:
其中:
x和y分别是水平和垂直像素坐标;
img[y, x]是位图在地点(y, x)上的像素值;
width是位图输入图像的宽度;以及
baseline[x]是基线在位置x上的y坐标。
3. 如权利要求1所述的系统,其中该参数化引擎被配置成至少一个控制参数约束参数曲线的至少一种特征。
4. 如权利要求3所述的系统,其中该参数化引擎被配置成通过控制参数确定的参数曲线的特征是参数曲线沿着文本行的最大变化率。
5. 如权利要求1所述的系统,其中该参数化引擎被配置成该参数曲线包括通过直线连接的多个控制点,其中该控制点被约束成只在垂直方向移动。
6. 如权利要求1所述的系统,其中该参数化引擎被配置成将该参数曲线定义成具有通过其样条系数确定的形状的B-样条。
7. 如权利要求1所述的系统,其中该参数化引擎被配置成使用优化技术使吻合函数最大。
8. 如权利要求7所述的系统,其中该参数化引擎被配置成从由遗传搜索和动态规划组成的群组中选择所述优化技术。
9. 如权利要求1所述的系统,其中该参数化引擎进一步包含为至少一个文本行确定平均高度的平均高度确定组件。
10. 如权利要求9所述的系统,其中该平均高度确定组件通过针对第二参数曲线使第二吻合函数最大来确定平均高度,其中第二吻合函数随着正好在第二参数曲线上面的像素的明亮度增大而增大,并且还随着第二参数曲线通过的像素的明亮度减小而增大。
11. 如权利要求10所述的系统,其中该平均高度确定组件通过如下步骤确定平均高度:
向上递增地将基线移动预定数量直到使偏移基线的第二吻合函数最大,其中第二吻合函数随着正好在偏移基线上面的像素的明亮度增大而增大,并且也随着偏移基线通过的像素的明亮度减小而增大。
12. 如权利要求11所述的系统,进一步包含为至少一个文本行确定x-高度的x-高度确定组件,其中x-高度等于将基线向上移动以便使第二吻合函数最大的预定数量之和。
13. 如权利要求1所述的系统,其中该参数化引擎为输入图像中的不同文本行组确定不同基线。
14. 如权利要求12所述的系统,其中该参数化引擎根据它们的主导笔划宽度将输入图像中的文本行划分到组。
15. 一种提取表征图像中的文本行的信息的方法,其包含:
接收包括文本行的输入图像的位图;以及
通过找出使吻合函数最大的参数曲线为图像中的至少一个文本行确定基线,该吻合函数取决于参数曲线通过的像素和在参数曲线下面的像素的数值,其中该基线对应于使吻合函数最大的参数曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180012992.4/1.html,转载请声明来源钻瓜专利网。