[发明专利]样本标注方法及计算机存储介质有效
申请号: | 201810134926.8 | 申请日: | 2018-02-09 |
公开(公告)号: | CN110135426B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 兴百桥 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 标注 方法 计算机 存储 介质 | ||
本发明提供了一种样本标注方法及计算机存储介质。样本标注方法包括:获取样本图像;通过字符检测模型对样本图像进行字符检测,获取样本图像中各字符的字符位置的字符框;根据字符框的数量和各个字符框的宽度确定字符框平均宽度;根据字符框平均宽度筛选出至少一个第一候选字符框;在水平方向上确定与当前第一候选字符框距离最小的字符框作为当前第二候选字符框,在竖直方向上确定与当前第一候选字符框距离最小且宽度大于第一参照值的字符框作为参照字符框;若在竖直方向上当前第二候选字符框的竖直中线穿过参照字符框,则确定当前第一候选字符框和当前第二候选字符框为候选待合并字符框;根据对候选待合并字符框的处理,生成样本图像的标注信息。
技术领域
本发明涉及计算机技术领域,尤其涉及一种样本标注方法及计算机存储介质。
背景技术
随着人工智能和机器学习技术的发展,越来越多的领域开始采用机器学习方法训练设备,使之具有一定的智能性。随之而来的是对训练样本的需求增长。例如,在训练光学字符检测模型和识别模型时都需要大量的标注样本,标注样本是指在真实样本上通过人工标注出用于指示字符位置的字符框和字符类别。现有的在获取真实样本时利用纯手工标注的方法,存在着效率低的问题,而且因为人工标注会有一定的精度损失,例如存在人工失误造成字符位置标注不准确,字符内容标注错误的情况,这使得标注后的样本在进行机器学习方法训练设备时效果不能发挥最好。
现有的字符检测模型可以实现自动化字符检测,并可以通过字符框的方式对字符进行标识,但也存在着一些问题,例如,由于汉字可能是左右结构、上下结构等,且一些汉字可以是独立的字,也可以是另一个字中的偏旁,使得字符检测模型可能将一个字的两个部分识别成单独的两个字符,使得字符检测的准确度下降,需要人工进行大量修正,增加了人工的劳动强度。在通过人工修正时,又存在着前述的人工标注精度低的问题。总之,现有的通过字符标注方法存在着效率低、精度不好的问题。
发明内容
有鉴于此,本发明实施例提供一种样本标注方法及计算机存储介质,以解决现有技术中真实样本标注准确率低的问题。
本发明实施例提供一种样本标注方法,包括:获取待标注的样本图像;通过字符检测模型对所述待标注的样本图像进行字符检测,并获取用于指示所述待标注的样本图像中各字符的字符位置的字符框;根据字符框的数量和各个字符框的宽度,确定字符框平均宽度;根据所述字符框平均宽度,从所有字符框中筛选出至少一个第一候选字符框;针对每个第一候选字符框,在水平方向上,确定与当前第一候选字符框距离最小的字符框作为当前第二候选字符框,在竖直方向上,确定与当前第一候选字符框距离最小且宽度大于第一参照值的字符框作为参照字符框;若在竖直方向上,当前第二候选字符框的竖直中线穿过所述参照字符框,则确定当前第一候选字符框和当前第二候选字符框为候选待合并字符框;若在竖直方向上,当前第二候选字符框的竖直中线未穿过所述参照字符框,则确定当前第一候选字符框和当前第二候选字符框不需要进行合并;根据对所述候选待合并字符框的处理,生成所述样本图像的标注信息。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有:用于获取待标注的样本图像的指令;用于通过字符检测模型对所述待标注的样本图像进行字符检测,并获取用于指示所述待标注的样本图像中各字符的字符位置的字符框的指令;用于根据字符框的数量和各个字符框的宽度,确定字符框平均宽度的指令;用于根据所述字符框平均宽度,从所有字符框中筛选出至少一个第一候选字符框的指令;用于针对每个第一候选字符框,在水平方向上,确定与当前第一候选字符框距离最小的字符框作为当前第二候选字符框,在竖直方向上,确定与当前第一候选字符框距离最小且宽度大于第一参照值的字符框作为参照字符框的指令;用于若在竖直方向上,当前第二候选字符框的竖直中线穿过所述参照字符框,则确定当前第一候选字符框和当前第二候选字符框为候选待合并字符框的指令;用于若在竖直方向上,当前第二候选字符框的竖直中线未穿过所述参照字符框,则确定当前第一候选字符框和当前第二候选字符框不需要进行合并的指令;用于根据对所述候选待合并字符框的处理,生成所述样本图像的标注信息的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810134926.8/2.html,转载请声明来源钻瓜专利网。