[发明专利]融入FFT的综合评价法的碎纸片纵横切拼接复原算法无效
申请号: | 201310458541.4 | 申请日: | 2014-01-12 |
公开(公告)号: | CN103679671A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 王浩;郑智隆;曹丹;邹孟霖;于思奇;孙翰斐;李子祺;张旭;余冬琪 | 申请(专利权)人: | 王浩 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T3/40;G06F17/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融入 fft 综合 评价 纸片 纵横 拼接 复原 算法 | ||
技术领域
本发明主要运用于中英文图像拼接(文字拼接)领域,设计了一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
背景技术
快速傅里叶变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅里叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的
发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步。快速傅氏变换算法可以运用到图像拼接的领域。
发明内容
单面印刷文字文件横纵切碎片的复原
为了探寻两个相邻碎片间的关系,本算法将各个碎片编码后矩阵的边缘列进行FFT快速傅里叶变换,因为最终图片的最左边全为白色,所以首先可以得到原图最左边一列,再将该碎片的最右列和其他碎片的最左列逐一进行互相关系数的计算,得出一族互相关系数,选取其中结果最大的一列的碎片进行匹配,得到最终结果。
傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。
对于信号的分析,很多情况下仅依靠时域是远远不够的,很多时域上不好分析的信号转入频域的分析中,立即变得便于分析。本算法依据分析的需要,分别将每个灰度矩阵的左上角和右上角看作起点,将0-1二值矩阵一列的取值看作y轴,将离散的点看作t轴,对其进行FFT处理。得到每个矩阵的边缘列的频谱。对它的特征进行提取,并分别计算它与其它碎纸片边缘的互相关系数,进行匹配。笔者认为,频谱特征接近,即互相关系数接近的两个碎纸片处在相邻的位置。
单面印刷文字横纵切片的复原难度比仅有纵向切片文件的复原大很多,一方面在于碎纸片变多使得编程变得困难和程序运行速度变慢,另一方面在于纸片变小导致的信息变少从而使得匹配更易于发生错误。本算法阐述了研究过程中方案的探索和最终使用的方案的改进。本算法分别对中文和英文的处理方法进行了分析。
本算法对于这种方案进行了分步处理。最后进行了一次人工干预,得到正确的结果。
本算法在此对中英文两种情况进行分别讨论,不同特征。
一、中文文件的复原
本算法对于中文文件的复原主要经过行分类、综合评价体系的建立以及人工干预组成。其算法流程图如图1所示:
(1) 行分类
① 分类方案的选取
首先,笔者经过观察发现,不是所有的标点都是全角的,所以不同行上面的字位置并不处在完全一样的列上。所以对于碎片的处理不能通过列分类而实现。之后,笔者经过观察发现,除去空行后,所有的碎片只有11种行的分布位置,所以可以先对它们进行行分类,之后再对于每一行类别的碎片进行相对位置的排序,即可恢复原文。
观察事例图片,本算法发现文字的汉字大小几乎一致,对所有碎片中汉字的纵向高度进行统计,本算法发现汉字的纵向高度为38-41个像素,但是汉字的上下却往往并不对齐,所以本算法对于所有汉字纵向的中心点纵坐标进行了记录,根据这些纵坐标的位置,并设定一个像素的阈值,对所有碎纸片进行行分类。
观察到事例图片中的行间距一致,而且大多数正规文件的行间距几乎一样宽,所以本算法首先假定图片中汉字的行间距一致,但是英文的行间距却并不完全一致,因此,本算法改变思路,转而去分析汉字高度。
因为每个汉字的高度有一定的出入,而且汉字的底也不太相同,再加上部分形如“一”的文字存在,所以本算法的分析思路基于汉字的中心点。为了证明这种想法的合理性,本算法对所有汉字纵向坐标进行分析,发现同一行的汉字中心纵坐标处在阈值为1的区间内,所以用这种方法对汉字进行行分类可以得到较好的结果。
② 灰度矩阵的预处理
每个汉字的大小不完全一样,一方面为了便于观察,另一方面为了减少部分形如“翁”之类的汉字中间空白部分的干扰。本算法首先对灰度矩阵进行预处理。因为本体
首先,将灰度矩阵以RGB值128作为阈值,转化为0-1二值矩阵。
之后,对生成的矩阵进行扫描,从上到下并且横向进行,一旦在某一行中遇到有一个像素为黑色,便将整行变成黑色,直到结束为止。为了防止形如“翁”的字干扰后续检验。此时,再对矩阵进行检验,将宽度小于20像素的白线全部变成黑色。
因为图片中的文本碎片均不含有噪音,所以噪音中黑点与白点的影响可以忽略不计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王浩,未经王浩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310458541.4/2.html,转载请声明来源钻瓜专利网。