[发明专利]一种文本图像区域检测模型的确定方法及装置在审
申请号: | 202210682256.X | 申请日: | 2022-06-16 |
公开(公告)号: | CN115082931A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 陈畅新;钟艺豪;蔡锐涛 | 申请(专利权)人: | 有米科技股份有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 江银会 |
地址: | 510006 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 区域 检测 模型 确定 方法 装置 | ||
本发明公开了一种文本图像区域检测模型的确定方法及装置,该方法包括:根据预设的检测网络构建算法,构建待训练检测网络模型,根据待训练检测网络模型,对待处理图像执行预设的图像处理操作,得到图像处理结果;根据预设的特征比对模块,对图像处理结果所包括的文本检测框坐标与预先确定的待处理图像的文本预标记坐标执行特征比对操作,得到特征比对结果;当特征比对结果表示待训练检测网络的训练参数大于等于预设的收敛阈值时,确定待训练检测网络模型为完成训练的目标检测网络模型。可见,实施本发明提供了一种文本图像区域检测模型构建以及训练方法,有利于提高图像区域中文本的检测准确率以识别准确率。
技术领域
本发明涉及文本检测技术领域,尤其涉及一种文本图像区域检测模型的确定方法及装置。
背景技术
大数据时代为了能够更好地宣传一款商品,通常会采用多模态的信息来进行商品宣传,最常见的就是图像、视频、文本和语音等。
为了增加商品的销量,将言简意赅的宣传文本添加到宣传模板中是最为常见的宣传手段,然而若是将宣传文本规规矩矩、整整齐齐地呈现在图像中,容易给消费者带来视觉疲劳,且宣传台本的宣传效果也将大打折扣,因此,为了能够更好地吸引消费者的眼球,广告设计师们通常会把普通的文本变换成各种艺术字,并采取扇形、环形,甚至是不规则的形状来展示,字体本身也是大小不一。正因为存在多种多样的文本展示方式,导致现有的文本检测技术在处理上述提及的多样化的图像时,文本检测准确率极低。可见,提供一种提高文本检测准确率的方法显得尤为重要。
发明内容
本发明所要解决的技术问题在于,提供一种文本图像区域检测模型的确定方法及装置,能够提高图像区域中文本的检测准确率,以及提高图像区域中文本的识别准确率。
为了解决上述技术问题,本发明第一方面公开了一种文本图像区域检测模型的确定方法,所述方法包括:
根据预设的检测网络构建算法,构建用于对输入的图像执行预设图像处理操作的待训练检测网络模型,所述待训练检测网络模型包括特征提取网络、特征融合网络以及多任务分支;
根据所述待训练检测网络模型,对待处理图像执行预设的图像处理操作,得到对应的图像处理结果,所述图像处理结果包括所述待处理图像对应的文本检测框坐标;
根据确定出的特征比对模块,对所述文本检测框坐标与预先确定出的所述待处理图像的文本预标记坐标执行特征比对操作,得到对应的特征比对结果,所述特征比对结果包括所述待训练检测网络对应的训练参数,所述训练参数用于确定所述待训练检测网络模型对应的训练收敛程度;
当所述特征比对结果表示所述训练参数大于等于预设的收敛阈值时,确定所述待训练检测网络模型为完成训练的目标检测网络模型。
作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
当所述特征比对结果表示所述训练参数小于预设的收敛阈值时,重复执行更新所述待训练检测网络模型对应的迭代次数以及根据所述迭代次数更新所述待训练检测网络模型,执行所述的根据所述待训练检测网络模型,对待处理图像执行预设的图像处理操作,得到对应的图像处理结果,以及执行所述的根据确定出的特征比对模块,对所述文本检测框坐标与预先确定出的所述待处理图像的文本预标记坐标执行特征比对操作,得到对应的特征比对结果的操作,直至当所述特征比对结果表示所述训练参数大于等于预设的收敛阈值时,确定所述待训练检测网络模型为完成训练的目标检测网络模型。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述待训练检测网络模型,对待处理图像执行预设的图像处理操作,得到对应的图像处理结果,包括:
根据所述待训练检测网络模型,对所述待处理图像执行预设的特征处理操作,得到对应的特征处理结果,所述特征处理操作包括特征提取操作以及特征融合操作,所述特征处理结果包括预设数量的特征处理图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210682256.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序