[发明专利]一种基于视觉计算的无接触式数据采集方法及系统在审
申请号: | 202211155147.9 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115546796A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 闵圣捷;方波;饶定远;唐雷 | 申请(专利权)人: | 中电智元数据科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06N3/04;G06V30/19 |
代理公司: | 成都玖和知识产权代理事务所(普通合伙) 51238 | 代理人: | 王海权 |
地址: | 100081 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 计算 接触 数据 采集 方法 系统 | ||
本发明公开了一种基于视觉计算的无接触式数据采集方法及系统,采集识别方法包括:S1:对场景中的内容进行捕捉,设置捕捉框对捕捉内容进行矫正,采集质量更好的图片数据;S2:对采集的图像数据进行预处理;S3:提取图像数据的连通分量进行迭代处理;S4:采用OCR模型进行字符识别,然后输出识别结果。本发明提出了增加图像采集和图像数据处理流程,这两个流程提高了图像处理的质量,有益于后续的图像识别,提出了有效的迭代模型对分类器训练的数据进行处理,可以增强分类器的分类性能。
技术领域
本发明涉及视觉计算的实际应用领域,尤其涉及一种基于视觉计算的无接触式数据采集方法及系统。
背景技术
字符识别是OCR系统中至关重要的一部分,它主要包含两种方法:模式识别和特征提取。模式识别的工作原理是将每个字符作为一个整体进行分析,并将其与存储在软件中的字符矩阵进行比较。这种方法通过对比输入字符和存储字符在形状和长短比例的相似度进行匹配。特征提取是一种更复杂、更通用的字符识别方法,更接近地模拟人类大脑处理文本的方式。利用特征提取技术可以将每个字符分解为单独的特征,识别直线、曲线、角度和交叉点;将这些字符的特征的与相应的字母进行匹配。然而,很多因素如:采集图像的清晰度形状、特征提
取的准确性、分类器的选择训练,都会影响字符识别的准确性。
针对上述传统识别模型的不足,有学者和专家提出了多种算法来改进OCR模型,然而还是存在不足之处:(1)只单独考虑到对OCR的模型进行改进,没有对整体流程进行改进。(2)虽然分类器的选择大多运用神经网络等一系列算法和模型,但是没有考虑到识别结果反过来对模型的影响。(3)识别结果通常会存在缺字或语义不通顺的问题。
综上,为了确保系统能够采集到无损坏高质量的图像数据,并且系统的字符识别模型能够有很高的准确性,以及对各种复杂的词性和连句有很好的处理能力,所以有必要设计一种能解决上述问题的基于视觉计算的无接触式数据采集方法。
发明内容
有鉴于此,本发明的目的之一是提供一种基于视觉计算的无接触式数据采集方法,从而突破传统接触式数据采集成本高对采集的数据有损耗的限制,并利用视觉计算的理论解决了图像数据采集处理中遇到的问题。
本发明的目的之一是通过以下技术方案实现的:
一种基于视觉计算的无接触式数据采集方法,所述方法包括:
采用无接触的方式采集图像数据;
对采集的图像数据进行处理;
迭代模型训练分类器;
利用OCR模型进行字符识别,输出识别结果。
进一步,对采集的图像数据进行处理具体为;
步骤S201:图像旋转;调整图像中要识别文本区域的方向,使其文本先平行于图像边界,设定一条直线作为文本区域的左边距,直线的斜率定义了页面旋转角度;
步骤S202:扫描图像;从左到右扫描每条水平线,将每条扫描线上第一个出现的黑色像素存储在数组D中,D={D1,D2,…,Dn},其中n表示第n条扫描线,m表示文本区域的最后一列;如第一条扫描线上的第一个黑色像素点位置为(x1,y1),依次类推到第n条扫描线上的第一个黑色像素点位置为(xn,y1);
D1=((x1,y1),(x1,y2),…,(x1,ym));
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电智元数据科技有限公司,未经中电智元数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211155147.9/2.html,转载请声明来源钻瓜专利网。