[发明专利]基于小样本的OCR模板学习方法、装置、电子设备及介质有效
申请号: | 202010057171.3 | 申请日: | 2020-01-19 |
公开(公告)号: | CN110874618B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 朱帆;邱君华;李宏宇;李晓林 | 申请(专利权)人: | 同盾控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 刘丽琴 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 ocr 模板 学习方法 装置 电子设备 介质 | ||
1.一种基于小样本的OCR模板学习方法,其特征在于:包括以下步骤:
获取图像数据集,根据所述图像数据集训练神经网络,得到通用文本检测模型,所述通用文本检测模型用于学习各种不同类型的OCR新模板;其中,所述神经网络包括特征提取层、像素分类网络和文本框位置网络;
获取待学习的新模板训练集,固定所述通用文本检测模型中的特征提取层参数,基于所述新模板训练集调整所述通用文本检测模型中的像素分类网络参数和文本框位置网络参数,获得目标模板,其中,所述新模板训练集包括新模板图像、像素分类标签值和文本框位置标签值;
其中,获取待学习的新模板训练集,包括:获取待学习的新模板图像;所述新模板图像的数量大于或等于一张;
基于所述新模板训练集调整所述通用文本检测模型中的像素分类网络参数和文本框位置网络参数,包括:所述新模板图像通过所述通用文本检测模型中的特征提取层计算得到新模板特征;所述新模板特征通过所述通用文本检测模型中的像素分类网络和文本框位置网络计算,分别得到第二置信度预测值和第二位置预测值;根据像素分类损失函数对所述第二置信度预测值和所述像素分类标签值进行计算得到分类损失,根据所述分类损失和误差反传算法调整所述像素分类网络参数;根据文本框位置损失函数对所述第二位置预测值和所述文本框位置标签值进行计算得到位置损失,根据所述位置损失和误差反传算法调整所述文本框位置网络参数,其中,所述文本框位置损失函数包括文本框位置边框损失函数和中心点距离损失函数;
根据文本框位置损失函数对所述第二位置预测值和所述文本框位置标签值进行计算得到位置损失,包括:根据所述第二位置预测值和所述文本框位置标签值得到区域交集和区域并集,根据所述文本框位置边框损失函数对所述区域交集和所述区域并集进行除法计算得到边框损失;根据所述第二位置预测值和所述文本框位置标签值得到两个中心坐标,根据所述中心点距离损失函数对所述两个中心坐标进行计算得到中心坐标损失;将所述边框损失和所述中心坐标损失相加得到所述位置损失。
2.如权利要求1所述的一种基于小样本的OCR模板学习方法,其特征在于:所述图像数据集包括文本图像数据和文本模板数据,根据所述图像数据集训练神经网络,得到通用文本检测模型,包括:
通过所述特征提取层对所述文本图像数据计算,得到图像特征;
通过所述像素分类网络和所述文本框位置网络对所述图像特征计算,分别得到第一置信度预测值和第一位置预测值;
根据所述第一置信度预测值、所述第一位置预测值和所述文本模板数据训练所述神经网络,得到所述通用文本检测模型。
3.如权利要求1所述的一种基于小样本的OCR模板学习方法,其特征在于:获取待学习的新模板训练集,还包括:
获取所述新模板图像待提取的文本区域;
根据预设的标注规则,计算所述文本区域的位置坐标,根据所述位置坐标,得到像素分类标签值和文本框位置标签值。
4.如权利要求1-3任一项所述的一种基于小样本的OCR模板学习方法,其特征在于:获得目标模板,包括:
当参数调整达到预设的调整目标时,得到完成调整的文本检测模型,根据调整后的所述文本检测模型,得到目标置信度和目标位置,根据所述目标置信度和所述目标位置,生成所述目标模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同盾控股有限公司,未经同盾控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010057171.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:投影镜头
- 下一篇:一种激光发射模组的控温测试治具