[发明专利]倾斜文本检测模型训练方法和票证图像文本检测方法在审
申请号: | 201910435630.4 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110135424A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 田强;邓冠群;李树凯 | 申请(专利权)人: | 阳光保险集团股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 崔振 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种倾斜文本检测模型训练方法和票证图像文本检测方法,该训练方法应用于包括第一网络单元、第二网络单元和第三网络单元的倾斜文本检测模型,其中,所述倾斜文本检测模型的文本训练,包括:将已标注的票证图像通过第一网络单元进行特征提取以获取特征图,并获取所述特征图中各像素点的水平候选框;对各水平候选框进行第一阶段回归并通过第二网络单元输出最小水平外接矩形建议框;将各最小水平外接建议框进行第二阶段回归。根据本发明的技术方案,可以实现对票证图像中的倾斜文本进行文本区域的检测,并且能在真实样本量不足时也能达到较高准确率,鲁棒性强等。 | ||
搜索关键词: | 倾斜文本 网络单元 票证图像 检测 模型训练 文本检测 候选框 特征图 特征提取 外接矩形 文本区域 文本训练 鲁棒性 像素点 样本量 回归 准确率 外接 标注 输出 | ||
【主权项】:
1.一种倾斜文本检测模型训练方法,其特征在于,应用于包括第一网络单元、第二网络单元和第三网络单元的倾斜文本检测模型,其中,所述倾斜文本检测模型的文本训练,包括:将已标注的票证图像通过所述第一网络单元进行特征提取以获取特征图,并对所述特征图中每一像素点生成初始水平候选框,将各像素点的初始水平候选框经过筛选处理后得到水平候选框;对各水平候选框进行第一阶段回归以获取每一水平候选框的第一标签,并将各水平候选框通过所述第二网络单元进行区域建议以输出每一水平候选框的预测类别和对应的第一预测偏移量,根据各水平候选框和所述第一预测偏移量计算及输出所述票证图像的最小水平外接建议框;对各最小水平外接建议框进行第二阶段回归以获取每一最小水平外接建议框的第二标签,并将所述特征图与各最小水平外接建议框通过所述第三网络单元进行区域预测以输出每一最小水平外接建议框的预测类别和对应的第二预测偏移量及第三预测偏移量;根据所述第一标签和所述第二标签设计目标损失函数,并利用预定数量的训练样本对所述倾斜文本检测模型进行训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光保险集团股份有限公司,未经阳光保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910435630.4/,转载请声明来源钻瓜专利网。