[发明专利]样本标注方法及计算机存储介质有效
申请号: | 201810134926.8 | 申请日: | 2018-02-09 |
公开(公告)号: | CN110135426B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 兴百桥 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种样本标注方法及计算机存储介质。样本标注方法包括:获取样本图像;通过字符检测模型对样本图像进行字符检测,获取样本图像中各字符的字符位置的字符框;根据字符框的数量和各个字符框的宽度确定字符框平均宽度;根据字符框平均宽度筛选出至少一个第一候选字符框;在水平方向上确定与当前第一候选字符框距离最小的字符框作为当前第二候选字符框,在竖直方向上确定与当前第一候选字符框距离最小且宽度大于第一参照值的字符框作为参照字符框;若在竖直方向上当前第二候选字符框的竖直中线穿过参照字符框,则确定当前第一候选字符框和当前第二候选字符框为候选待合并字符框;根据对候选待合并字符框的处理,生成样本图像的标注信息。 | ||
搜索关键词: | 样本 标注 方法 计算机 存储 介质 | ||
【主权项】:
1.一种样本标注方法,其特征在于,包括:获取待标注的样本图像;通过字符检测模型对所述待标注的样本图像进行字符检测,并获取用于指示所述待标注的样本图像中各字符的字符位置的字符框;根据字符框的数量和各个字符框的宽度,确定字符框平均宽度;根据所述字符框平均宽度,从所有字符框中筛选出至少一个第一候选字符框;针对每个第一候选字符框,在水平方向上,确定与当前第一候选字符框距离最小的字符框作为当前第二候选字符框,在竖直方向上,确定与当前第一候选字符框距离最小且宽度大于第一参照值的字符框作为参照字符框;若在竖直方向上,当前第二候选字符框的竖直中线穿过所述参照字符框,则确定当前第一候选字符框和当前第二候选字符框为候选待合并字符框;若在竖直方向上,当前第二候选字符框的竖直中线未穿过所述参照字符框,则确定当前第一候选字符框和当前第二候选字符框不需要进行合并;根据对所述候选待合并字符框的处理,生成所述样本图像的标注信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810134926.8/,转载请声明来源钻瓜专利网。