[发明专利]基于条件对抗网络的缺损古籍汉字修复方法有效
申请号: | 201910571713.6 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110335212B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 张九龙;郭铭涛;屈晓娥 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T5/50 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 王蕊转 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 条件 对抗 网络 缺损 古籍 汉字 修复 方法 | ||
本发明公开了一种基于条件对抗网络的缺损古籍汉字修复方法,首先建立n个文件夹,分别对应n个不同的手写汉字图像,每个文件夹内分别放入m个汉字图像,最终得到n*m张图片,作为手写汉字数据集;然后将得到的手写汉字图像数据进行训练,通过梯度反向传播算法迭代更新辨别器神经网络权重和生成器神经网络权重;最后将待处理的缺损手写汉字图像数据样本带入更新的辨别器和生成器中进行迭代,得到修复后的手写汉字图像。本发明解决了现有技术中存在的大量破损的古籍文献中损毁字体的修复困难的问题。
技术领域
本发明属于图像处理技术领域,具体涉及一种基于条件对抗网络的缺损古籍汉字修复方法。
背景技术
图像作为一个信息的载体,在文化传承中具有举足轻重的意义。目前很多的古籍文献由于受到不同温度、湿度和气候的影响均受到了不同程度的破坏,其中至关重要的部分就是文献中的汉字,承载着中华优秀的文明。令人惋惜的是有些汉字损毁严重,虽然能够靠人力根据上下文推断来修复,但是古籍文献数量众多,单靠人力来修复的成本和时间难以估量。因此,通过计算机技术替代人力来修复汉字图像是十分有必要的。
鉴于以上种种原因,如何精确地修复缺损汉字,同时又不破坏上下文语义信息,成为当下急需解决的一个问题。
发明内容
本发明的目的是提供一种基于条件对抗网络的缺损古籍汉字修复方法,解决了现有技术中存在的大量破损的古籍文献中损毁字体的修复困难的问题。
本发明所采用的技术方案是,基于条件对抗网络的缺损古籍汉字修复方法,具体按照以下步骤实施:
步骤1、建立n个文件夹,分别对应n个不同的手写汉字图像,每个文件夹内分别放入m个汉字图像,最终得到n*m张图片,作为手写汉字数据集;
步骤2、将步骤1中得到的手写汉字图像数据进行训练,通过梯度反向传播算法迭代更新辨别器神经网络权重和生成器神经网络权重;
步骤3、将待处理的缺损手写汉字图像数据样本带入经步骤2更新的辨别器和生成器中进行迭代,得到修复后的手写汉字图像。
本发明的特点还在于,
步骤2具体按照以下步骤实施:
步骤2.1、随机从均值为μ,标准差为σ的高斯分布中取k维的向量z,同时在n个文件夹内随机选取其中一个文件夹内的某个图像,一个文件夹对应一个标签y,将向量z和标签y同时输入生成器G网络,随后输出标签y对应的汉字图像,该输入对应的生成结果fake_img=G(z,y);首先向量z先经过一个神经元个数为512×4×4的全连接层FC,然后分别经过四个生成器的残差模块G_ResBlock,四个残差模块的神经元个数分别为512,256,128和64,同时标签y也输入到上述四个残差模块中,把第四个残差模块的输出作为批量归一化层BN的输入,修正线性激活单元ReLU和卷积层Conv,最后将卷积层的输出作为Tanh激活函数的输入,经过激活函数后的所得即为生成的汉字图像;
步骤2.2、将步骤2.1得到的图像fake_img=G(z,y)和取自文件夹内的汉字图像x,分别输入辨别器网络D,输出概率值D(x)和D(fake_img),对抗网络损失函数如下:
其中,表示x,y服从Pdata真实数据概率分布的期望;表示z服从pz分布,y服从Pdata真实数据概率分布的期望;
步骤2.3、公式(1)分解为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910571713.6/2.html,转载请声明来源钻瓜专利网。