[发明专利]一种基于融合字体的抗打印扫描攻击的数字水印方法有效
申请号: | 201811420067.5 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109582926B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 牛少彰;王贺;高玉龙;王心怡 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06T1/00;G06N3/04 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 王刚;龚敏 |
地址: | 100088 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 融合 字体 打印 扫描 攻击 数字 水印 方法 | ||
1.一种基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,具体包括以下步骤:
S1、构建常用汉字字库、中文字体库;
S2、确定目标文档的字体;
S3、通过条件生成对抗网络模型,将所述常用汉字字库中每个汉字的源字体图片与目的字体图片进行风格迁移,生成新字体图片集合;
S4、对所述新字体图片集合进行筛选,制作成字体图像库;
S5、根据待嵌入信息,从所述字体图像库中查找出与目标文档的待替换汉字所属同一汉字的目标新字体图片,将所述目标新字体图片替换掉目标文档的待替换汉字;
S6、根据所述字体图像库,从扫描文档中查找出携带水印汉字,根据携带水印汉字提取隐藏水印信息;
其中,步骤S5具体为:
S51、将目标文档转换为二值化图片;
S52、通过投影算法找出所述目标文档中每个汉字的位置;
S53、按照文档中的汉字排序,对每个汉字进行OCR识别,并判断当前汉字是否存在于所述字体图像库中,若不存在,则判断下一个汉字是否存在于所述字体图像库中;若存在,则将当前汉字作为待替换汉字,执行步骤S54;
S54、从所述字体图像库中查找出所述待替换汉字对应的类别,根据待嵌入信息从该类别中查找出目标新字体图片,将所述目标新字体图片替换掉所述目标文档的待替换汉字。
2.根据权利要求1所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,所述步骤S3生成新字体图片集合的具体步骤为:
S31、将目标文档字体作为源字体,中文字体库中的其中一种字体作为目的字体;
S32、通过条件生成对抗网络模型,将所述常用汉字字库中每个汉字的源字体图片与目的字体图片,进行风格迁移,生成具有同一字体特征的新字体图片;
S33、将目的字体依次替换为中文字体库中的其他字体,重复步骤S32,生成多种不同字体风格的新字体图片,构成新字体图片集合。
3.根据权利要求1所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,所述步骤S4制作字体图像库的具体步骤为:
S41、通过卷积神经网络对新字体图片集合进行筛选;
S42、将筛选出的新字体图片,按照汉字类别进行分类,制成字体图像库,一个汉字对应唯一一个类别,每个类别中均包含有同一汉字的多种字体风格的新字体图片。
4.根据权利要求3所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,在所述步骤S41之前,对新字体图片集合进行人工筛选,将筛选出的图片送入卷积神经网络。
5.根据权利要求3所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,每个类别中的多张新字体图片按照卷积神经网络的筛选顺序进行排列。
6.根据权利要求5所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,所述每个类别均对应有一个用以存储所述新字体图片的文件夹,所述文件夹以其存储的图片中的汉字来命名。
7.根据权利要求1所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,所述步骤S54中根据待嵌入信息从所述待替换汉字对应的类别中查找目标新字体图片的具体步骤为:
确定所述待替换汉字所属类别中包含的新字体图片数量n;
计算所述待替换汉字可嵌入的m比特信息,其中,n=2m,m和n均为正整数;
将待嵌入信息的二进制数据的前m位转换为十进制d,则该类别中第d张新字体图片即为目标新字体图片。
8.根据权利要求1所述的基于融合字体的抗打印扫描攻击的数字水印方法,其特征在于,所述步骤S6提取隐藏水印信息的具体步骤为:
S61、将扫描文档转换为二值化图片;
S62、通过投影算法找出所述扫描文档中每个汉字的位置;
S63、按照文档中的汉字排序,对每个汉字进行OCR识别,并判断当前汉字是否存在于所述字体图像库中,若不存在,则判断下一个汉字是否存在于所述字体图像库中;若存在,则当前汉字即为携带水印汉字,执行步骤S64;
S64、获取携带水印汉字在其所属类别中排列的位置编号,该位置编号所对应的二进制数据即为该汉字隐藏的水印信息;
S65、重复步骤S63、S64,提取出扫描文档中隐藏的全部水印信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811420067.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人机结合的语料标注方法及系统
- 下一篇:PDF报表数据提取方法及装置