[发明专利]识别文本错误的方法、装置、设备和计算机可读介质在审
申请号: | 202011493542.9 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112241739A | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 陈越;郑志凯;左佳伟;王林芳;梅涛 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 郭晗;赵迪 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 文本 错误 方法 装置 设备 计算机 可读 介质 | ||
本发明公开了识别文本错误的方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:基于预设文本模板图像,得到待识别文本图像;通过预设文字检测模型以单个字符为单位,检测所述待识别文本图像中的文字,得到所述待识别文本图像中每个文字区域的坐标;按照所述文字区域的坐标定位文字区域,并在所述文字区域中结合所述预设文本模板图像,识别出文本错误。该实施方式能够普查产品上的所有文本,以实现文本的高精度检查。
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别文本错误的方法、装置、设备和计算机可读介质。
背景技术
文本错误的识别是工业质检中的流程之一。通常需要判断产品上的文本是否存在漏印、错印,并且判断文本印刷的位置和大小是否正确。
然而,现有技术中至少存在如下问题:难以普查产品上的所有文本,以实现文本的高精度检。
发明内容
有鉴于此,本发明实施例提供一种识别文本错误的方法、装置、设备和计算机可读介质,能够普查产品上的所有文本,以实现文本的高精度检查。
为实现上述目的,根据本发明实施例的一个方面,提供了一种识别文本错误的方法,包括:
基于预设文本模板图像,得到待识别文本图像;
通过预设文字检测模型以单个字符为单位,检测所述待识别文本图像中的文字,得到所述待识别文本图像中每个文字区域的坐标;
按照所述文字区域的坐标定位文字区域,并在所述文字区域中结合所述预设文本模板图像,识别出文本错误。
所述通过预设文字检测模型以单个字符为单位,检测所述待识别文本图像中的文字,得到所述待识别文本图像中每个文字区域的坐标,包括:
通过预设文字检测模型以单个字符为单位,检测所述待识别文本图像中的文字,得到所述待识别文本图像中每个文字区域的原始坐标;
外扩所述文字区域,并对外扩后的文字区域做二值化操作,以确定坐标修正值;
采用所述坐标修正值更新所述文字区域的原始坐标,得到所述待识别文本图像中每个文字区域的坐标。
所述外扩所述文字区域,并对外扩后的文字区域做二值化操作,以确定坐标修正值,包括:
按照预设比例外扩所述文字区域;
根据外扩后的文字区域每行像素中像素值和预设像素阈值确定列向量元素,所述列向量中元素按照所述每行像素的行顺序排列;
分别从所述列向量的起始元素和所述列向量的末端元素开始,确定第一个大于预设显示数量阈值的元素的位置;
将从所述列向量的起始元素确定的位置作为第一纵坐标修正值,将从所述列向量的末端元素确定的位置作为第二纵坐标修正值。
所述采用所述坐标修正值更新所述文字区域的原始坐标,得到所述待识别文本图像中每个文字区域的坐标,包括:
所述文字区域的原始坐标包括所述文字区域的左上角坐标和所述文字区域的右下角坐标,
采用所述第一纵坐标修正值、所述预设比例、所述文字区域的左上角纵坐标和所述文字区域的右下角纵坐标,更新所述文字区域的左上角纵坐标;
采用所述第二纵坐标修正值、所述预设比例、所述文字区域的左上角纵坐标和所述文字区域的右下角纵坐标,更新所述文字区域的右下角纵坐标。
所述在所述文字区域中结合所述预设文本模板图像,识别出文本错误,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011493542.9/2.html,转载请声明来源钻瓜专利网。