[发明专利]文档图像压缩方法及其在文档认证中的应用有效
申请号: | 201310740957.5 | 申请日: | 2013-12-27 |
公开(公告)号: | CN103914858A | 公开(公告)日: | 2014-07-09 |
发明(设计)人: | 田宜彬;明伟 | 申请(专利权)人: | 柯尼卡美能达美国研究所有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈炜;李德山 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 压缩 方法 及其 认证 中的 应用 | ||
1.一种用于对表示包含文本区域的文档的二值图像进行压缩的方法,所述方法包括:
(a)将所述文本区域分割为多个符号图像,每个符号图像表示文本的符号,每个符号图像以具有位置和大小的边界框来界定;
(b)将在步骤(a)中所获得的每个符号图像分类为多个类别之一,每个类别由模板图像和类别索引来表示,对于所分类的每个符号图像,步骤(b)包括:
(b1)将所述符号图像与每个模板图像进行比较以确定它们是否彼此匹配,包括将所述符号图像的多个特征与所述模板图像的相应多个特征进行比较,所述多个特征包括密度统计特征、侧面轮廓特征、拓扑统计特征及形状特征;
(b2)如果在步骤(b1)中找到匹配,则与所分类的符号图像相关联地记录与所匹配的模板对应的类别索引;以及
(b3)如果在步骤(b1)中没有找到匹配,则通过使用所分类的符号图像的图像作为新类别的模板图像并为所述新类别分配类别索引,来将所述新类别添加到所述多个类别,并且与所分类的符号图像相关联地记录所述类别索引;
(c)将每个类别的模板图像的大小调整为最终大小;以及
(d)将所述多个类别中的每个类别的经大小调整后的模板图像连同其类别索引、在步骤(a)中所获得的每个符号图像的边界框的位置和大小、以及在步骤(b2)或(b3)中所获得的每个符号图像的类别索引存储为压缩的图像数据。
2.根据权利要求1所述的方法,其中,步骤(a)包括:将所述文本区域分割为多个行,将所述多个行分割为多个词,以及将所述多个词分割为所述多个符号图像。
3.根据权利要求1所述的方法,其中,所述密度统计特征包括分区轮廓特征,其中,所述形状特征包括低阶矩特征,以及
其中,对于所比较的每个模板图像,步骤(b1)包括:
计算第一差别数量、第二差别数量、第三差别数量和第四差别数量,所述第一差别数量、第二差别数量、第三差别数量和第四差别数量分别表示所述符号图像的、与所述模板图像的相应特征不同的分区轮廓特征的数量、侧面轮廓特征的数量、拓扑统计特征的数量和低阶矩特征的数量;以及
其中,如果所述第一差别数量小于或等于第一阈值,所述第二差别数量小于或等于第二阈值,所述第三差别数量小于或等于第三阈值,以及所述第四差别数量小于或等于第四阈值,则确定所述符号图像和所述模板图像彼此匹配。
4.根据权利要求1所述的方法,其中,所述密度统计特征包括分区轮廓特征,其中,所述形状特征包括低阶矩特征,以及
其中,对于每个所比较的模板图像,步骤(b1)包括:
计算第一差别数量、第二差别数量、第三差别数量和第四差别数量,所述第一差别数量、第二差别数量、第三差别数量和第四差别数量分别表示所述符号图像的、与所述模板图像的相应特征不同的分区轮廓特征的数量、侧面轮廓特征的数量、拓扑统计特征的数量和低阶矩特征的数量;以及
其中,如果所述第一差别数量至所述第四差别数量的和小于或等于阈值,则确定所述符号图像和所述模板图像彼此匹配。
5.根据权利要求1所述的方法,在步骤(b)之后以及在步骤(c)之前还包括如下步骤:
如果在步骤(b)中被分类为第一类别的符号图像的总数低于阈值并且所述第一类别的分类置信度的度量低于另一阈值,则将所述多个类别中的所述第一类别合并到所述多个类别中的第二类别中。
6.根据权利要求1所述的方法,其中,在步骤(c)中,至少一些模板图像的最终大小是彼此不同的,其中,步骤(c)包括:
(c1)计算每个模板图像与每个其它模板图像的相似度度量;
(c2)基于算出的与其它模板图像的相似度度量,确定每个模板图像的最终大小;以及
(c3)将每个模板图像的大小调整为在步骤(c2)中所确定的最终大小。
7.根据权利要求6所述的方法,其中,对于每对模板图像,步骤(c1)包括:
计算第一差别数量、第二差别数量、第三差别数量和第四差别数量,所述第一差别数量、第二差别数量、第三差别数量和第四差别数量分别表示该对模板图像的彼此不同的分区轮廓特征的数量、侧面轮廓特征的数量、拓扑统计特征的数量和低阶矩特征的数量;以及
对所述第一差别数量至所述第四差别数量求和作为所述相似度度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柯尼卡美能达美国研究所有限公司,未经柯尼卡美能达美国研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310740957.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序