[发明专利]基于OCR技术的文字清晰度转化方法、系统、终端及介质在审
申请号: | 202111450118.0 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114220109A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 汪媛 | 申请(专利权)人: | 越读(浙江)数字科技有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/148;G06V30/19;G06V10/74;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 312000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ocr 技术 文字 清晰度 转化 方法 系统 终端 介质 | ||
1.一种基于OCR技术的文字清晰度转化方法,其特征在于:包括:
获取古文字图像;
依据古文字图像生成字符参数;
依据字符参数确定各个字符的识别区域;
识别各个识别区域,生成对应各个字符的形状特征;
将字符的形状特征与预设的古文字数据库对比,确定古文字字体样式;
依据所属古文字字体样式及古文字数据库识别字符的形状特征,查找对应的高清字符模型并依据高清字符模型生成高清字符;
依据原有字符编排顺序编排所有高清字符;
执行校对操作,依据校对结果调整高清字符;
输出显示有高清字符的高清图像。
2.根据权利要求1所述的基于OCR技术的文字清晰度转化方法,其特征在于:所述字符参数包括字符尺寸、字符行间距;
所述字符参数的生成方法包括:
获取并对古文字图像执行图像二值化处理,生成二值图像;
依据二值图像区分字符区与间隙区;
筛选出间隙区内形成的闭合环状图形;
依据所有闭合环状图形的尺寸,计算并生成字符参数。
3.根据权利要求2所述的基于OCR技术的文字清晰度转化方法,其特征在于:在所述依据字符参数确定各个字符的识别区域的步骤后,还包括;
获取所述闭合环状图形;
依据闭合环状图形及预设约束条件,生成闭合环状的识别框,识别框内形成对应字符的识别区域;
于所述识别框上显示缩放控件,缩放控件用于响应于触发指令调整识别框的尺寸;
基于触发指令,重新确定识别区域。
4.根据权利要求1所述的基于OCR技术的文字清晰度转化方法,其特征在于:预设的所述古文字数据库包括多组古文字模型组,每组古文字模型组对应至少一种古文字字体样式,所述古文字模型组包括多个高清字符模型及对应高清字符模型的多个对比模型;
所述将字符的形状特征与预设的古文字数据库对比,确定古文字字体样式的步骤中,包括:
对比字符的形状特征与所有古文字模型组内的对比模型;
查找出特征相似度最高的对比模型;
依据该对比模型确定字符的古文字字体样式。
5.根据权利要求4所述的基于OCR技术的文字清晰度转化方法,其特征在于:所述依据所属古文字字体样式及古文字数据库识别字符的形状特征,查找对应的高清字符模型并依据高清字符模型生成高清字符的步骤中,包括:
获取字符的形状特征与所有古文字模型组内的对比模型的对比结果;
依据上述对比结果查找出特征相似度最高的对比模型;
调取该对比模型所对应的高清字符模型;
依据该高清字符模型生成高清字符。
6.根据权利要求5所述的基于OCR技术的文字清晰度转化方法,其特征在于:所述校对操作包括:
获取古文字图像中原有的字符及其对应的高清字符,并将两者显示于人机交互界面上;
于该人机交互界面上显示一组相似字符,该组相似字符包含与该原有的字符特征相似度排名位于前列的多个对比模型或与上述对比模型对应的高清字符模型;
所述相似字符上显示有重选控件,所述重选控件用于响应于触发指令调取该相似字符对应的高清字符模型以用于替换原有的高清字符。
7.根据权利要求6所述的基于OCR技术的文字清晰度转化方法,其特征在于:所述获取古文字图像中原有的字符及其对应的高清字符,并将两者显示于人机交互界面上的步骤后,还包括:
于人机交互界面上显示查看控件,每个查看控件对应一个原有的字符,所述查看控件用于响应于触发指令显示对照弹窗,所述对照弹窗显示有部分古文字图像,且该部分古文字图像中包含该原有的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于越读(浙江)数字科技有限公司,未经越读(浙江)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111450118.0/1.html,转载请声明来源钻瓜专利网。