[发明专利]图片文档分割方法和系统有效
申请号: | 200880021247.4 | 申请日: | 2008-05-01 |
公开(公告)号: | CN101681432A | 公开(公告)日: | 2010-03-24 |
发明(设计)人: | A·沃林;斯蒂芬·史密斯;B·特里贝尔霍恩;A·菲尔德;Z·多德斯 | 申请(专利权)人: | 计算机连接管理中心公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李向英 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 文档 分割 方法 系统 | ||
对相关申请的交叉引用
根据35U.S.C.119(e),本申请要求2007年5月1日 提出的编号为No.60/927,256的美国临时申请案和2007年5月1 日提出的编号为No.60/927,308的美国临时申请案的优先权,这里 引用了这两个申请的全部内容作为参考。
技术领域
本申请一般涉及用于处理数字图像的方法和系统,更具体 来说,用于处理包括文档图像和周围的图像的数字图像的方法和系统。
背景技术
文档管理系统正在变得越来越流行。这样的系统减轻了存 储和处理文档的大型数据库的负担。为将这样的系统与纸张文件一起 使用,必须捕获要以电子方式存储的纸张文件的数字图像。
有各种用于捕获纸张文件的数字图像的潜在的设备,包括 数码相机、扫描仪,以及带有内置数码相机的移动电话。文档的数字 图像也可以通过数字化利用常规胶卷照相机捕获的文档的图像来获 得。还存在各种用于处理通过这样的设备捕获的纸张文件的数字图像 的系统。例如,已知使用被称为“分割”的过程将捕获的图像中的文档 图像与其余部分或周围的图像分开。
虽然分割过程可以适用于照相机和扫描仪捕获的图像,但 是,在扫描仪捕获的图像中比在照相机捕获的图像中更加容易将成像 文档与周围的图像分开。这是因为,当使用照相机时捕获图像的条件 比使用扫描仪时的条件更易于变化。此外,更加可能的是,当使用照 相机捕获文档的图像时,将遇到对于现有的分割技术不是最适合的条 件-包括阴影,照明不良、背景模糊,图像中有多个文档,以及由于 皱纹、回纹针,撕破等等造成的夹杂物。使用照相机也可能引入图像 失真,而这在扫描仪捕获的图像中一般不太普遍。这样的失真可以包 括由照相机相对于文档的角度(“透视失真”)、照相机所使用的镜头 以及其与文档的距离、文档的相对平整性(例如,被成像文档是否位 于平面或弯曲表面上)及其他因素所引起的失真。结果,当前已知的 分割技术在许多情况下不能充分地对捕获的图像进行分割,特别是当 捕获的图像是使用照相机捕获的时。因此,需要用于将文档的捕获的 数字图像分割为成像文档以及其周围的图像的改善的系统和方法。更 具体来说,需要当遇到上文所提及的一个或多个低于最优条件的条件 时提供改善的分割速度的分割的系统和方法。
发明内容
本专利文件提供了用于处理包括成像文档和周围的图像的 数字图像的改善的分割方法和系统。对于本专利文件来说,包括成像 文档和周围的图像的数字图像应该理解为指显示所关心文档的所有四 个边缘的至少某个部分的数字图像。
在一个实施例中,系统和方法使用多个边缘检测技术来确 定成像文档的边缘线,然后,从周围的图像分割出成像文档。在另一 个实施例中,提供了一种方法,包括:通过至少两个不同的计算机实 现的边缘检测技术,查找所述成像文档的潜在边缘;将查找到的潜在 的边缘分组为顶部、底部、左和右边潜在的边缘组;对于每一个边缘 组,选择被确定为可能代表成像文档的边缘的潜在边缘的子集;根据 潜在边缘的子集,确定所述成像文档边缘;以及,使用确定的所述成 像文档的边缘,从所述数字图像分割出所述成像文档。
在优选实现方式中,根据潜在边缘的子集,确定所述成像 文档边缘的步骤包括从潜在边缘的子集产生多个边缘集的过程。优选 情况下,产生多个边缘集的过程包括确定可以根据子集确定的每一个 可能的边缘集。从潜在边缘的子集确定所述成像的边缘文档的步骤, 优选情况下,进一步包括基于预定义的比较准则,选择最准确地代表 所述成像文档的边缘的边缘集。所使用的预定义的比较准则优选情况 下提供边缘集的匹配度量,并可以包括,例如,梯形性、面积、对比 度、纹理,以及线条扩展或收缩。优选情况下,给该方法中使用的预 定义的选择标准赋予权重,以反映它们在确定最有可能代表所述成像 文档的真实的边缘的边缘集中的相对重要性。
根据本专利文件的另一个方面,提供了用于处理包括成像 文档和周围的图像的数字图像的方法,该方法包括下列步骤:使用一 个或多个计算机实现的边缘检测技术,产生所述成像文档的多个潜在 的边缘集;基于预定义的比较准则,从所述多个边缘集中选择最准确 地代表所述成像文档的边缘的边缘集;以及,使用所述确定的所述成 像文档的边缘,从所述数字图像分割出所述成像文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于计算机连接管理中心公司,未经计算机连接管理中心公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880021247.4/2.html,转载请声明来源钻瓜专利网。