[发明专利]文字处理方法、装置、存储介质以及电子设备在审
申请号: | 202310249617.6 | 申请日: | 2023-03-10 |
公开(公告)号: | CN116227465A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 张宏韬;卢健;冯如;杨宇喆 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/242;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字处理 方法 装置 存储 介质 以及 电子设备 | ||
1.一种文字处理方法,其特征在于,包括:
识别初始图片中的待消除文字,得到多个待消除文字;
获取每个待消除文字在所述初始图片中的位置信息,得到多个位置信息;
将所述多个位置信息与所述初始图片输入文字消除模型中,得到目标图片,其中,所述目标图片中不存在所述多个待消除文字。
2.根据权利要求1所述的方法,其特征在于,识别初始图片中的待消除文字,得到多个待消除文字包括:
识别所述初始图片中的每个文字,得到多个初始文字;
根据所述多个初始文字之间的相对位置关系和文字间隔将所述多个初始文字进行组合,得到多组文本信息;
通过词典库从所述多组文本信息中筛选待消除文本信息,得到多组待消除文本信息,其中,所述待消除文本信息为位于所述词典库中的文本信息;
将组成所述多组待消除文本信息的初始文字确定为所述多个待消除文字。
3.根据权利要求1所述的方法,其特征在于,在将所述多个位置信息与所述初始图片输入文字消除模型之前,所述方法还包括:
获取第一图片,将第一图片中的文字的位置信息进行标注,得到第一位置信息,并将第一图片中的文字进行删除,得到第二图片,其中,所述第一图片中包括文字;
将所述第一图片、所述第一位置信息与所述第二图片组合为第一子样本信息;
获取第三图片,将预设文本信息添加至第三图片中,得到第四图片,并将所述第四图片中的所述预设文本信息的位置信息进行标注,得到第二位置信息,其中,所述第三图片中不包括文字,所述预设文本信息中包括需要删除的异常关键字;
将所述第三图片、所述第二位置信息与所述第四图片组合为第二子样本信息;
将所述第一子样本信息和所述第二子样本信息组合为目标样本信息,并通过所述目标样本信息对初始模型进行训练,得到所述文字消除模型。
4.根据权利要求3所述的方法,其特征在于,将第一图片中的文字进行删除,得到第二图片包括:
将所述第一图片中的文字删除,得到第一候选图片;
使用图片的背景内容填充被删除的文字部分,得到所述第二图片。
5.根据权利要求1所述的方法,其特征在于,在将所述多个位置信息与所述初始图片输入文字消除模型中,得到目标图片之后,所述方法还包括:
确定所述初始图片中的待消除文字所处的图片区域,得到第一图片区域,并从所述初始图片中截取所述第一图片区域,得到第一截图;
从所述目标图片中截取所述第一图片区域,得到第二截图;
将所述第一截图与所述第二截图输入对比模型中进行对比,得到目标相似度;
判断所述目标相似度是否小于预设相似度;
在所述目标相似度小于所述预设相似度的情况下,将所述目标图片作为所述初始图片,重新执行所述将所述多个位置信息与所述初始图片输入文字消除模型中,得到目标图片的步骤,直至所述目标相似度大于等于所述预设相似度;
在所述目标相似度大于等于所述预设相似度的情况下,得到更新后的目标图片。
6.根据权利要求1所述的方法,其特征在于,获取每个待消除文字在所述初始图片中的位置信息,得到多个位置信息包括:
将所述初始图片添加至预设坐标系中,并确定组成每个待消除文字的像素点在所述预设坐标系中的坐标信息,得到多组坐标信息;
将每个待消除文字对应的一组坐标信息组合为待消除文字的位置信息,得到多个位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310249617.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据库表空间的在线重组方法、装置、设备和介质
- 下一篇:燃油滤清器及车辆