[发明专利]一种隐形编码检测方法有效
申请号: | 201010152316.4 | 申请日: | 2005-09-16 |
公开(公告)号: | CN101799869A | 公开(公告)日: | 2010-08-11 |
发明(设计)人: | 王东临 | 申请(专利权)人: | 北京书生国际信息技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K19/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 隐形 编码 检测 方法 | ||
1.一种隐形编码检测方法,其特征在于,包括:
对待识别文件进行扫描,生成图像文件;其中,所述待识别文件为待检 测文档或其碎片,其中,通过对原始文档上全部或部分字进行版式变形嵌入 隐形编码获得所述待检测文档;
生成原始文档的图像;
将待识别文件的图像以及原始文档的图像分别做OCR识别;
对待识别文件的图像和原始文档的图像的OCR识别结果用碎片匹配方 法进行处理,得到待识别文件的每个字和原始文档的每个字的对应关系;
根据待识别文件的每个字和原始文档的每个字的对应关系,对待识别文 件中的每个字的版式变形进行判别;
得到待识别文件中每个字与原始文档中的字在版式上的差别;
根据隐形编码的嵌入规则,得到嵌入的隐形编码。
2.根据权利要求1所述的方法,其特征在于,通过人工方式,或者计算 机和人工结合的方式判别待识别文件中每个字的版式变形。
3.根据权利要求1所述的方法,其特征在于,通过对原始文档上全部或 部分字进行版式变形嵌入隐形编码获得所述待检测文档包括:
将一类的版式变形作为一个通道,选择至少一个通道来表现要嵌入到文 档中的隐形编码;
确定隐形编码对于各类版式变形的编码序列;
根据确定的编码序列对从原始文档中选出需要进行版式变形的字进行版 式变形获得所述待检测文档。
4.根据权利要求3所述的方法,其特征在于,进一步包括:
根据对待识别文件中的每个字的版式变形的判别结果,标记上每个字的 变形编号,并确定所属版式变形的种类,即确定所属通道;
对每一个通道,根据已知的编码序列长度以及待识别文件中每个字与原 始文档的对应关系得到所述编码序列的每一位的统计结果;
对每一个通道,根据统计结果得到的编码序列进行解码,得到每一通道 的隐形编码。
5.根据权利要求4所述的方法,其特征在于,当从统计结果得到的不是 一个完整编码序列且所缺的编码位数超过了纠错范围时,则枚举缺失的编码 位的所有组合,形成一个可能的编码序列集合,然后再通过人工方式确定编 码序列。
6.根据权利要求4所述的方法,其特征在于,进一步包括:
对各通道获取的隐形编码进行汇总,以确定所获取的待识别文件嵌入的 隐形编码。
7.根据权利要求1至6任一所述的方法,其特征在于,所述版式变形包 括:
文档中文字个体的变形。
8.根据权利要求7所述的方法,其特征在于,所述对文档中文字个体的 变形包括:对文字的尺寸、文字的排版位置、字体的改变。
9.根据权利要求3至6任一所述的方法,其特征在于,对于每份文档, 不同的通道嵌入的隐形编码不同或者相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京书生国际信息技术有限公司,未经北京书生国际信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010152316.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新型耐高压高温测速仪
- 下一篇:一种海洋浮标传感监测网