[发明专利]文本检测模型的训练方法、文本检测方法及装置有效
申请号: | 202111401778.X | 申请日: | 2021-11-24 |
公开(公告)号: | CN114065868B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 范峻植;曾定衡;王洪斌;周迅溢;蒋宁 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/14;G06V10/82;G06T3/40;G06V30/148;G06N3/04;G06N3/06;G06N3/08 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 徐晨影 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 模型 训练 方法 装置 | ||
1.一种文本检测模型的训练方法,其特征在于,包括:
对第一样本图片进行裁剪处理,所述第一样本图片对应第一文本区域标签,文本区域标签用于标记图片的实际文本区域;
在裁剪得到的图片的周围填充目标像素,得到目标尺寸的扩展图片,所述目标尺寸小于所述第一样本图片的尺寸,以及基于所述第一文本区域标签,确定所述扩展图片对应的第二文本区域标签;
对所述扩展图片进行缩放处理得到第一缩放图片,所述第一缩放图片的尺寸小于所述第一样本图片的尺寸;
基于所述第一缩放图片和所述第二文本区域标签,确定所述第一缩放图片对应的第三文本区域标签;
将所述第一缩放图片输入文本检测模型,输出所述第一缩放图片的第一疑似文本区域;
基于所述第一疑似文本区域、所述第三文本区域标签以及预设损失函数,更新所述文本检测模型的模型参数。
2.根据权利要求1所述的方法,其特征在于,所述对第一样本图片进行裁剪处理,包括:从所述第一样本图片中随机裁剪出样本子图片;
所述基于所述第一文本区域标签,确定所述扩展图片对应的第二文本区域标签,包括:基于所述第一文本区域标签和所述目标像素在所述扩展图片中的填充位置,确定所述扩展图片对应的第二文本区域标签。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一缩放图片和所述第二文本区域标签,确定所述第一缩放图片对应的第三文本区域标签,包括:
基于所述第一缩放图片对应的尺寸和所述扩展图片的尺寸,确定所述第一缩放图片相对所述扩展图片的缩放比例;
基于所述缩放比例和所述第二文本区域标签,确定所述第三文本区域标签。
4.根据权利要求1所述的方法,其特征在于,所述对所述扩展图片进行缩放处理,得到第一缩放图片,包括:
将所述扩展图片输入缩放模型,输出所述第一缩放图片;
在基于所述第一疑似文本区域、所述第三文本区域标签以及预设损失函数,更新所述文本检测模型的模型参数之后,所述方法还包括:
基于所述第一疑似文本区域、所述第三文本区域标签以及预设损失函数,确定所述文本检测模型的损失值;
基于所述文本检测模型的模型参数,将所述损失值反向传播至所述缩放模型;
基于传播至所述缩放模型的损失值,更新所述缩放模型的模型参数。
5.根据权利要求4所述的方法,其特征在于,所述缩放模型包括:第一线性缩放层、第二线性缩放层、第一卷积层、融合层、第一归一化层以及至少两级特征提取模块,所述特征提取模块包括依次连接的第二卷积层、激活层及第二归一化层;
所述第一线性缩放层设置于所述至少两级特征提取模块中任意相邻的两级特征提取模块之间,所述第二线性缩放层的输入端与所述至少两级特征提取模块中的第一级特征提取模块的输入端连接,所述第一卷积层的输入端与所述第一线性缩放层的输出端连接;
所述融合层的输入端分别与所述第一线性缩放层的输出端、所述第一卷积层的输出端及所述至少两级特征提取模块中的最后一级特征提取模块的输出端连接,所述融合层的输出端与所述第二归一化层的输入端连接,所述第二归一化层的输出端为所述缩放模型的输出端。
6.根据权利要求1所述的方法,其特征在于,在基于所述第一疑似文本区域、所述第三文本区域标签以及预设损失函数,更新所述文本检测模型的模型参数之后,所述方法还包括:
对第二样本图片进行缩放处理得到第二缩放图片,以及确定所述第二缩放图片对应的第四文本区域标签;
将所述第二缩放图片输入所述文本检测模型,输出所述第二缩放图片的第二疑似文本区域;
基于所述第二疑似文本区域及所述第四文本区域标签,验证所述文本检测模型,得到验证结果;
若所述验证结果未达到预设要求,则执行对第一样本图片进行裁剪处理至验证所述文本检测模型的步骤,直到得到的验证结果达到所述预设要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111401778.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢管切割装置
- 下一篇:一种单相全桥逆变器主电路及单相全桥逆变器