[发明专利]倾斜文本检测模型训练方法和票证图像文本检测方法在审
申请号: | 201910435630.4 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110135424A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 田强;邓冠群;李树凯 | 申请(专利权)人: | 阳光保险集团股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 崔振 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 倾斜文本 网络单元 票证图像 检测 模型训练 文本检测 候选框 特征图 特征提取 外接矩形 文本区域 文本训练 鲁棒性 像素点 样本量 回归 准确率 外接 标注 输出 | ||
1.一种倾斜文本检测模型训练方法,其特征在于,应用于包括第一网络单元、第二网络单元和第三网络单元的倾斜文本检测模型,其中,所述倾斜文本检测模型的文本训练,包括:
将已标注的票证图像通过所述第一网络单元进行特征提取以获取特征图,并对所述特征图中每一像素点生成初始水平候选框,将各像素点的初始水平候选框经过筛选处理后得到水平候选框;
对各水平候选框进行第一阶段回归以获取每一水平候选框的第一标签,并将各水平候选框通过所述第二网络单元进行区域建议以输出每一水平候选框的预测类别和对应的第一预测偏移量,根据各水平候选框和所述第一预测偏移量计算及输出所述票证图像的最小水平外接建议框;
对各最小水平外接建议框进行第二阶段回归以获取每一最小水平外接建议框的第二标签,并将所述特征图与各最小水平外接建议框通过所述第三网络单元进行区域预测以输出每一最小水平外接建议框的预测类别和对应的第二预测偏移量及第三预测偏移量;
根据所述第一标签和所述第二标签设计目标损失函数,并利用预定数量的训练样本对所述倾斜文本检测模型进行迭代训练;
其中,所述第一标签包括水平候选框的类别标签和第一偏移量标签,所述“对各水平候选框进行第一阶段回归以获取每一水平候选框的第一标签”包括:
获取所述已标注的票证图像中各文本区域的人工标注旋转矩形框并计算每一旋转矩形框对应的最小水平外接矩形框;
分别计算当前的水平候选框与各最小水平外接矩形框的第一重叠系数,并根据所述第一重叠系数和第一组预设阈值的大小确定所述当前的水平候选框的类别标签,所述类别标签包括前景类和背景类;
将与所述当前的水平候选框的第一重叠系数最大的最小水平外接矩形框作为第一参考候选框,并计算所述当前的水平候选框与所述第一参考候选框的第一偏移量标签;
其中,所述第一网络单元包括至少一卷积层,所述第二网络单元包括第一卷积层、第二卷积层和第三卷积层,各个所述水平候选框依次输入所述第一卷积层后输出第一分支和第二分支,所述第一分支经过所述第二卷积层后输出所述水平候选框的预测类别;所述第二分支经过所述第三卷积层后输出所述水平候选框对应的第一预测偏移量。
2.根据权利要求1所述的倾斜文本检测模型训练方法,其特征在于,所述第二标签包括最小水平外接建议框的类别标签、第二偏移量标签和第三偏移量标签,所述“对各最小水平外接建议框进行第二阶段回归以获取每一最小水平外接建议框的第二标签”包括:
分别计算当前的最小水平外接建议框与各最小水平外接矩形框的第二重叠系数,并根据所述第二重叠系数和第二组预设阈值的大小确定所述当前的最小水平外接建议框的类别标签;
将与所述当前的最小水平外接建议框的第二重叠系数最大的最小水平外接矩形框作为第二参考候选框,并计算所述当前的最小水平外接建议框与所述第二参考候选框的第二偏移量标签;
计算所述当前的最小水平外接建议框和与所述第二参考候选框对应的旋转矩形框的第三偏移量标签。
3.根据权利要求2所述的倾斜文本检测模型训练方法,其特征在于,所述第三网络单元包括最大池化层、第四卷积层、平均池化层、第一全连接层和第二全连接层,
所述特征图和所述最小水平外接建议框依次输入所述最大池化层、第四卷积层和平均池化层后输出第一支路和第二支路,所述第一支路经过所述第一全连接层后输出所述最小水平外接建议框的预测类别;所述第二支路经过所述第二全连接层后输出所述最小水平外接建议框对应的第二预测偏移量和第三预测偏移量。
4.根据权利要求1所述的倾斜文本检测模型训练方法,其特征在于,所述“利用预定数量的训练样本对所述倾斜文本检测模型进行迭代训练”包括:
根据第一预设训练步数和第一预设学习率对所述倾斜文本检测模型进行第一阶段训练;
根据第二预设训练步数和第二预设学习率对所述倾斜文本检测模型进行第二阶段训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光保险集团股份有限公司,未经阳光保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910435630.4/1.html,转载请声明来源钻瓜专利网。