[发明专利]光学字符识别测试方法、装置、可读存储介质及终端设备在审
申请号: | 202011019006.5 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112287936A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 刘旋;黄国昌;权申文;刘远明 | 申请(专利权)人: | 深圳市智影医疗科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市龙华区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光学 字符 识别 测试 方法 装置 可读 存储 介质 终端设备 | ||
本申请属于计算机技术领域,尤其涉及一种光学字符识别测试方法、装置、计算机可读存储介质及终端设备。所述方法包括:根据预设的数据模板和参数配置信息生成光学字符识别测试数据,并标记与所述光学字符识别测试数据对应的标签;将所述光学字符识别测试数据输入预设的光学字符识别引擎中进行识别,并获取所述光学字符识别引擎输出的识别结果;将所述识别结果与所述标签进行比对,并根据比对结果确定所述光学字符识别引擎的识别准确率。相较于依赖人工作业的传统测试方法,本申请减少了测试工作量,缩短了测试耗时,避免了人为导致的差错,极大提升了测试效率。
技术领域
本申请属于计算机技术领域,尤其涉及一种光学字符识别测试方法、装置、计算机可读存储介质及终端设备。
背景技术
光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,亦即将图像中的文字进行识别,并以文本的形式返回。目前,银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等很多行业都已经应用了OCR技术。OCR技术降低了人力成本,提高了工作效率。
OCR引擎的识别准确率是衡量OCR引擎性能的重要指标。传统的OCR引擎的识别准确率的测试方法主要由人工进行,这种测试方法工作量大、耗时长、易出错、测试效率低下。
发明内容
有鉴于此,本申请实施例提供了一种OCR测试方法、装置、计算机可读存储介质及终端设备,以解决现有的OCR测试方法工作量大、耗时长、易出错、测试效率低下的问题。
本申请实施例的第一方面提供了一种OCR测试方法,可以包括:
根据预设的数据模板和参数配置信息生成OCR测试数据,并标记与所述OCR测试数据对应的标签;
将所述OCR测试数据输入预设的OCR引擎中进行识别,并获取所述OCR引擎输出的识别结果;
将所述识别结果与所述标签进行比对,并根据比对结果确定所述OCR引擎的识别准确率。
进一步地,所述根据预设的数据模板和参数配置信息生成OCR测试数据,可以包括:
根据所述参数配置信息确定所述数据模板中的待填写位置以及填写形式;
根据所述参数配置信息生成ID;
将所述ID按照所述填写形式填写入所述数据模板中的待填写位置,生成所述OCR测试数据。
进一步地,所述根据所述参数配置信息生成ID,可以包括:
读取所述参数配置信息中的ID长度和连续指示参数;
若所述连续指示参数为预设的第一数值,则生成连续的符合所述ID长度的ID;
若所述连续指示参数为预设的第二数值,则读取所述参数配置信息中的ID个数;按照所述ID个数,随机生成符合所述ID长度的ID。
进一步地,所述标记与所述OCR测试数据对应的标签,可以包括:
将所述ID标记为与所述OCR测试数据对应的标签。
进一步地,所述将所述识别结果与所述标签进行比对,可以包括:
确定所述标签的长度;
从所述识别结果中提取出连续的数字串,并确定提取出的各个数字串的长度;
根据各个数字串的长度选取等长数字串,所述等长数字串与所述标签的长度一致;
将选取出的各个等长数字串分别与所述标签进行比对,判断是否存在与所述标签相等的等长数字串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市智影医疗科技有限公司,未经深圳市智影医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011019006.5/2.html,转载请声明来源钻瓜专利网。