[发明专利]一种手写图像生成方法、模型训练方法、装置及设备在审
申请号: | 202110779401.1 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113516136A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 李颢宇;裴洪斌;马超;赵滢 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06K9/68 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 图像 生成 方法 模型 训练 装置 设备 | ||
本说明书实施例提供一种手写图像生成方法、模型训练方法、装置及设备,可应用于人工智能技术领域。所述方法包括:获取手写样本图像;所述手写样本图像对应有手写文字内容;提取所述手写样本图像的样本手写风格特征;所述样本手写风格特征用于表示所述手写文字内容对应的风格;将手写文字内容和样本手写风格特征输入扩散模型中得到对应于所述手写样本图像的至少两个目标样本图像;所述扩散模型用于根据噪声调整所生成的目标样本图像。上述方法提高了目标手写图像的多样性,在利用目标手写图像对相应模型进行训练时,保证了训练得到的模型对不同风格的手写图像识别时的准确度。
技术领域
本说明书实施例涉及人工智能技术领域,特别涉及一种手写图像生成方法、模型训练方法、装置及设备。
背景技术
随着近些年来人工智能技术的发展,基于相应的人工智能模型可以实现越来越多的功能,从而帮助用户对业务进行处理,以改善工作处理效果,提升业务处理效率。具体的,可以借助OCR技术实现对于图像中的文字的识别,从而便于计算机针对图像中的文字进行处理。
目前在进行文字识别时,不仅需要考虑对于印刷字体的识别,还需要考虑对于包含手写字体的图像的识别。手写字体相较于印刷字体,具有更为复杂的形态、格式,而且由于不同人具有不同的书写风格,使得在对图像中的手写字体进行识别时,需要考虑书写风格对文字的影响,相应的也具有更高的复杂度。
在对手写文字进行识别时,一般需要先利用训练样本数据对识别模型进行训练,以利用训练后的模型实现手写文字识别。但是,由于手写文字风格的多样性,所获取到训练样本数据往往无法涵盖大部分的手写风格,进而使得训练得到的识别模型针对一般的手写图像往往无法获取到较好的识别效果,相应地影响后续业务的处理。因此,目前亟需一种能够生成多样化的手写图像的技术方案。
发明内容
本说明书实施例的目的是提供一种手写图像生成方法、模型训练方法、装置及设备,以解决如何生成多样化的手写图像的问题。
为解决上述技术问题,本说明书实施例提供一种手写图像生成方法,包括:获取手写样本图像;所述手写样本图像对应有手写文字内容;提取所述手写样本图像的样本手写风格特征;所述样本手写风格特征用于表示所述手写文字内容对应的风格;将手写文字内容和样本手写风格特征输入扩散模型中得到对应于所述手写样本图像的至少两个目标样本图像;所述扩散模型用于根据噪声调整所生成的目标样本图像;所述目标样本图像之间具有不同的手写风格特征。
本说明书实施例还提出一种手写图像生成装置,包括:手写样本图像获取模块,用于获取手写样本图像;所述手写样本图像对应有手写文字内容;样本手写风格特征提取模块,用于提取所述手写样本图像的样本手写风格特征;所述样本手写风格特征用于表示所述手写文字内容对应的风格;目标样本图像获取模块,用于将手写文字内容和样本手写风格特征输入扩散模型中得到对应于所述手写样本图像的至少两个目标样本图像;所述扩散模型用于根据噪声调整所生成的目标样本图像;所述目标样本图像之间具有不同的手写风格特征。
本说明书实施例还提出一种手写图像生成设备,包括存储器和处理器;所述存储器,用于存储计算机程序指令;所述处理器,用于执行所述计算机程序指令以实现以下步骤:获取手写样本图像;所述手写样本图像对应有手写文字内容;提取所述手写样本图像的样本手写风格特征;所述样本手写风格特征用于表示所述手写文字内容对应的风格;将手写文字内容和样本手写风格特征输入扩散模型中得到对应于所述手写样本图像的至少两个目标样本图像;所述扩散模型用于根据噪声调整所生成的目标样本图像;所述目标样本图像之间具有不同的手写风格特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110779401.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于计算机LED屏的旋转结构
- 下一篇:一种蚕丝接枝率的测定方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序