[发明专利]图像处理方法、装置、计算机设备及存储介质有效
申请号: | 202111041464.3 | 申请日: | 2021-09-07 |
公开(公告)号: | CN113496225B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 任旭华;孙子荀 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V20/62;G06V10/26;G06V10/56;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例提供了一种图像处理方法、装置、计算机设备及存储介质,可以应用于云技术、人工智能、区块链、智慧交通、车载、游戏等各种领域或场景,其中方法包括:获取待合成文本和待合成图像;根据所述待合成图像生成背景图像,其中,当所述待合成图像包括字符信息时,所述背景图像是根据去除掉所述字符信息的待合成图像生成的;获取所述背景图像的辅助图像特征,并根据所述辅助图像特征确定所述待合成文本的显示特征;根据所述显示特征将所述待合成文本和所述背景图像进行合成,得到合成文本图像。通过本申请实施例可以有效提高文本图像的合成效率以及有效提高合成文本图像的合成效果。
技术领域
本申请涉及计算机技术领域,尤其涉及图像处理方法、图像处理装置、计算机设备及计算机可读存储介质。
背景技术
随着人工智能技术的发展,光学字符识别(Optical Character Recognition,OCR)技术应运而生,光学字符识别OCR是指对包含文本资料的图像资料文件(可简称为文本图像)进行分析识别处理,获取文字及版面信息的技术。在实际应用中,通常是训练一个OCR文本检测模型来实现对文本图像的文本检测,以获取文本图像的文字及版面信息。OCR文本检测模型的训练通常需要大量的文本图像作为训练语料,而往往现有的真实文本图像的数量不能满足训练要求,如果由人工去实际拍摄足够数量的真实文本图像则会耗费大量的人力和时间成本。为快速且容易的获取到足够数量的文本图像,可以采用合成文本图像的方式,但如何合成效果佳的文本图像是有待解决的问题。
发明内容
本申请实施例提供了一种图像处理方法、装置、计算机设备及存储介质,可以有效提高文本图像的合成效率以及合成文本图像的合成效果。
一方面,本申请实施例提供了一种图像处理方法,所述方法包括:
获取待合成文本和待合成图像;
根据所述待合成图像生成背景图像,其中,当所述待合成图像包括字符信息时,所述背景图像是根据去除掉所述字符信息的待合成图像生成的;
获取所述背景图像的辅助图像特征,并根据所述辅助图像特征确定所述待合成文本的显示特征;
根据所述显示特征将所述待合成文本和所述背景图像进行合成,得到合成文本图像。
一方面,本申请实施例提供了一种图像处理装置,所述装置包括:
获取单元,用于获取待合成文本和待合成图像;
处理单元,用于根据所述待合成图像生成背景图像,其中,当所述待合成图像包括字符信息时,所述背景图像是根据去除掉所述字符信息的待合成图像生成的;
所述处理单元,还用于获取所述背景图像的辅助图像特征,并根据所述辅助图像特征确定所述待合成文本的显示特征;
所述处理单元,还用于根据所述显示特征将所述待合成文本和所述背景图像进行合成,得到合成文本图像。
在一实施例中,所述处理单元,具体用于:
获取所述背景图像的深度特征图;提取所述背景图像的颜色特征信息和纹理特征信息,根据所述颜色特征信息和所述纹理特征信息对所述背景图像进行区域分割处理,得到所述背景图像的第一区域分割图;将所述深度特征图和所述第一区域分割图确定为所述背景图像的辅助图像特征。
在一实施例中,所述处理单元,具体用于:
根据所述第一区域分割图,确定所述待合成文本在所述背景图像中的显示区域;根据所述深度特征图,确定所述背景图像中所述显示区域的深度信息,并根据所述深度信息确定所述待合成文本的显示深度;将所述显示区域和所述显示深度确定为所述待合成文本的显示特征。
在一实施例中,所述处理单元,还用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111041464.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序