[发明专利]页面扭曲校正方法及系统、电子设备和计算机可读介质在审
申请号: | 202110839253.8 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113610089A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 安晟;杨森;王岩;王岩;蔡红 | 申请(专利权)人: | 作业帮教育科技(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 喻颖 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 扭曲 校正 方法 系统 电子设备 计算机 可读 介质 | ||
一种页面扭曲校正方法及系统、电子设备和计算机可读介质。所述页面扭曲校正方法包括:确定当前待校正的目标文字行,并在所述目标文字行选取若干校验点,所述若干校验点满足:在页面不扭曲时所述若干校验点的连线与校正参考线重合或平行;将所述若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量;根据计算的所述偏移量对所述目标文字行的各文字进行校正。本发明的方法简单高效,还原性好,适应性强,校正结果更稳定。
技术领域
本发明属于图像识别和处理技术领域,更具体的是涉及一种页面扭曲校正方法及系统、电子设备和计算机可读介质。
背景技术
随着技术进步,现在的学生在遇到难题时可以通过手机拍摄不会解的难题进行全网络搜索答案,极大地便利了对知识的求索,弥补了师资的缺乏。在手机拍摄过程中,由于承载题目的纸张有可能弯折变形,导致拍摄得到的页面有可能也会随之拉伸变形,增加了文字识别的难度。在传统的扫描仪和复印机领域,也存在对变形页面的简单校正工艺,但其只是识别出页面的四个顶角进行简单的系数运算,并不能校正页面卷曲带来的字体扭曲失真的情形。因此,现有的页面扭曲校正技术还存在很大的不足,迫切需要研究开发一种新的校正方法及系统。
发明内容
有鉴于此,本发明的主要目的在于提出一种页面扭曲校正方法及系统、电子设备和计算机可读介质,以期至少部分地解决上述技术问题中的至少之一。
为了实现上述目的,作为本发明的第一个方面,提出了一种页面扭曲校正方法,包括如下步骤:
确定当前待校正的目标文字行,并在所述目标文字行选取若干校验点,所述若干校验点满足:在页面不扭曲时所述若干校验点的连线与校正参考线重合或平行;
将所述若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量;
根据计算的所述偏移量对所述目标文字行的各文字进行校正。
可选地,所述确定当前待校正的目标文字行之前,所述方法还包括:识别待校正页面图像中的文字行;
可选地,所述识别待校正页面图像中的文字行的步骤,包括以下方式中的任一种或多种的结合:
检测所述待校正页面图像中的文字目标,并获取所述文字目标的位置信息;基于所述文字目标的位置信息,确定位于同一行上的文字行;或者,
根据所述待校正页面图像的图像灰度来识别所述待校正页面图像中的文字行,如果所述待校正页面图像存在横向或纵向延伸的灰度区域且宽度满足预设值则判定为文本行;或者
通过用于检测图像中的文本行的人工智能模型检测所述文字行。
可选地,所述检测待校正页面图像中的文字目标,并获取所述文字目标的位置信息的步骤,包括以下方式中的任一种或多种的结合:
通过对所述待校正页面图像进行OCR识别来检测所述文字目标,并获取识别出的所述文字目标的位置信息;
通过用于检测图像中的文字目标的人工智能模型检测所述文字目标,获取检测出的所述文字目标的位置信息。
可选地,所述在目标文字行选取若干校验点的步骤,包括:基于所述目标文字行的长度和字体大小,在字体高度设定一个比例等间距采样若干校验点;
可选地,选取所述文字的字体宽度和/或高度方向上的设定比例位置处的点作为校验点;
可选地,所述文字目标为印刷字体;
可选地,所述方法还包括:根据计算的所述偏移量对与所述目标文字行相邻行的文字进行校正;
可选地,所述方法还包括:根据计算的所述偏移量对与所述目标文字行扭曲一致的区域进行校正;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于作业帮教育科技(北京)有限公司,未经作业帮教育科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110839253.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纺织生产用纺织染色装置
- 下一篇:标定数据的管理方法、系统、介质及设备