[发明专利]文本图像合成方法、装置、存储介质及电子设备在审
申请号: | 202111197890.6 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113936187A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 肖杨;马文伟;王亚领;刘设伟 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V20/62;G06V30/412;G06V30/414;G06K9/62 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 郑特强;石海霞 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 合成 方法 装置 存储 介质 电子设备 | ||
本公开涉及图像处理技术领域,具体涉及一种文本图像合成方法、装置、存储介质及电子设备。该文本图像合成方法包括:读取文本图像,并对所述文本图像进行文本检测得到文本字体范围和文本高度范围,以及对所述文本图像进行内容检测得到禁止贴片区域;获取待合成文本,并根据所述待合成文本、所述文本字体范围和所述文本高度范围生成所述待合成文本对应的文本贴片;基于预设的贴片方式和所述禁止贴片区域判断所述文本贴片是否满足预设的合成条件;在所述文本贴片满足合成条件时,将所述文本贴片放置在所述文本图像中以得到合成文本图像。本公开提供的文本图像合成方法能够解决文本图像合成中合成内容与真实样本相似度低的问题。
技术领域
本公开涉及图像处理技术领域,具体涉及一种文本图像合成方法、文本图像合成装置、存储介质及电子设备。
背景技术
在金融、保险等应用场景中涉及到各类影像中文字的识别与结构化,在业务系统中需要对重要影像中的信息进行录入、校验等,利用OCR技术识别理赔影像,可以节省人力,缩短理赔时耗。
在实际客户上传的影像中,字符种类丰富,基于深度学习的文字识别需要庞大的数据集支撑,通常需要千万级的文本条数据量。但真实的业务场景较难获取大规模的数据,受限于训练样本的内容,导致文字识别系统存在泛化能力差,识别精度较低的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种文本图像合成方法、文本图像合成装置、存储介质及电子设备,旨在解决文本图像合成中合成内容与真实样本相似度低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一方面,提供了文本图像合成方法,包括:读取文本图像,并对所述文本图像进行文本检测得到文本字体范围和文本高度范围,以及对所述文本图像进行内容检测得到禁止贴片区域;获取待合成文本,并根据所述待合成文本、所述文本字体范围和所述文本高度范围生成所述待合成文本对应的文本贴片;基于预设的贴片方式和所述禁止贴片区域判断所述文本贴片是否满足预设的合成条件;在所述文本贴片满足合成条件时,将所述文本贴片放置在所述文本图像中以得到合成文本图像。
根据本公开的一些实施例,基于前述方案,所述获取待合成文本,并根据所述待合成文本、所述文本字体范围和所述文本高度范围生成所述待合成文本对应的文本贴片,包括:从语料列表中随机选取待合成文本;以及从所述文本字体范围中随机选取一文本字体;以及从所述文本高度范围中随机确定一高度值,并根据所述高度值确定文本字号;根据所述待合成文本、所述文本字体和所述文本字号生成所述文本贴片。
根据本公开的一些实施例,基于前述方案,所述基于预设的贴片方式和所述禁止贴片区域判断所述文本贴片是否满足预设的合成条件,包括:按预设的贴片方式确定所述文本图像的第一边界和第二边界,以及确定所述文本图像中一预放置坐标;根据所述预放置坐标和所述文本贴片的尺寸信息确定所述文本贴片的预放置区域;在所述预放置区域未超过所述第一边界和所述第二边界且未遮挡所述禁止贴片区域时,返回满足合成条件;在所述预放置区域超过所述第一边界时,返回不满足合成条件。
根据本公开的一些实施例,基于前述方案,所述方法还包括:在所述预放置区域未超过所述第一边界但超过所述第二边界时,以第一方式更新所述预放置坐标;或者未超过所述第一边界和所述第二边界但遮挡所述禁止贴片区域时,以第二方式更新所述预放置坐标;根据更新后的所述预放置坐标判断所述文本贴片是否满足所述合成条件。
根据本公开的一些实施例,基于前述方案,所述方法还包括:在所述贴片方式为从左往右再从上往下,所述第一边界为下边界,所述第二边界为右边界,所述预放置坐标为所述文本图像的左上角坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111197890.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序