[发明专利]一种基于注意力机制的手写字符擦除方法及系统在审
申请号: | 202211391605.9 | 申请日: | 2022-11-08 |
公开(公告)号: | CN116009749A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 杨辉;黄家昌;赵宝华;邱道椿 | 申请(专利权)人: | 福建亿能达信息技术股份有限公司 |
主分类号: | G06F3/04845 | 分类号: | G06F3/04845;G06V10/774;G06V30/148;G06V30/19 |
代理公司: | 福州市京华专利代理事务所(普通合伙) 35212 | 代理人: | 王美花 |
地址: | 350000 福建省福州市鼓楼*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 手写 字符 擦除 方法 系统 | ||
1.一种基于注意力机制的手写字符擦除方法,其特征在于:包括如下步骤:
步骤S10、获取大量的包含手写字符和印刷体的原始图片,基于所述原始图片构建图片集;
步骤S20、对所述图片集进行数据增强处理和图片预处理,进而得到训练数据集;
步骤S30、基于注意力机制创建一擦除模型;
步骤S40、利用所述训练数据集对擦除模型进行训练;
步骤S50、利用训练后的所述擦除模型对待擦除图片的手写字符进行自动擦除。
2.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S10具体为:
获取大量的包含手写字符和印刷体的原始图片,利用图像编辑软件去除各所述原始图片中的手写字符得到目标图片,对各所述目标图片进行掩码处理得到掩码图片,基于各所述原始图片、目标图片以及掩码图片构建图片集。
3.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S20具体为:
对所述图片集中的各图片进行随机旋转、随机翻转、亮度变换以及随机灰度化的数据增强处理;
设定一图片尺寸,基于所述图片尺寸对数据增强处理后的图片进行裁剪以完成图片预处理,进而得到训练数据集。
4.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S30中,所述擦除模型设有一语义分割模块、一粗擦除模块以及一精细擦除模块;
所述语义分割模块用于对图片进行语义分割,以区分手写字符和印刷体;所述粗擦除模块用于对图片的手写字符进行一次擦除;所述精细擦除模块用于对图片的手写字符进行二次擦除;
所述语义分割模块、粗擦除模块以及精细擦除模块均基于注意力机制的Unet架构;所述语义分割模块以及粗擦除模块公用特征提取部分;所述语义分割模块以及粗擦除模块的高级网络层设有CBAM单元以及ASPP单元;所述精细擦除模块的低级网络层设有Non-Local自注意力单元,且网络特征通道数大于所述粗擦除模块的网络特征通道数。
5.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S40具体为:
将所述训练数据集中的原始图片输入擦除模型进行训练,获取预测目标图片和预测掩码图片,通过目标损失函数计算所述训练数据集中的目标图片与预测目标图片的目标损失值,通过掩码损失函数计算所述训练数据集中的掩码图片与预测掩码图片的掩码损失值,累加所述目标损失值和掩码损失值得到总损失值,对所述擦除模型持续进行训练,直至达到预设的训练迭代数;
所述目标损失函数为平均绝对误差函数;所述掩码损失函数为交叉熵损失函数。
6.一种基于注意力机制的手写字符擦除系统,其特征在于:包括如下模块:
图片集构建模块,用于获取大量的包含手写字符和印刷体的原始图片,基于所述原始图片构建图片集;
训练数据集构建模块,用于对所述图片集进行数据增强处理和图片预处理,进而得到训练数据集;
擦除模型创建模块,用于基于注意力机制创建一擦除模型;
擦除模型训练模块,用于利用所述训练数据集对擦除模型进行训练;
手写字符擦除模块,用于利用训练后的所述擦除模型对待擦除图片的手写字符进行自动擦除。
7.如权利要求6所述的一种基于注意力机制的手写字符擦除系统,其特征在于:所述图片集构建模块具体用于:
获取大量的包含手写字符和印刷体的原始图片,利用图像编辑软件去除各所述原始图片中的手写字符得到目标图片,对各所述目标图片进行掩码处理得到掩码图片,基于各所述原始图片、目标图片以及掩码图片构建图片集。
8.如权利要求6所述的一种基于注意力机制的手写字符擦除系统,其特征在于:所述训练数据集构建模块具体用于:
对所述图片集中的各图片进行随机旋转、随机翻转、亮度变换以及随机灰度化的数据增强处理;
设定一图片尺寸,基于所述图片尺寸对数据增强处理后的图片进行裁剪以完成图片预处理,进而得到训练数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建亿能达信息技术股份有限公司,未经福建亿能达信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391605.9/1.html,转载请声明来源钻瓜专利网。