[发明专利]一种电子文件的旋转校正方法和装置在审
申请号: | 202011422419.8 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112364868A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 赵仪琳;王伟伟;王腾飞 | 申请(专利权)人: | 共道网络科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06T3/60 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 文件 旋转 校正 方法 装置 | ||
本申请提供一种电子文件的旋转校正方法和装置,所述方法包括:获取待校正的目标电子文件图像;将所述目标电子文件图像输入角度识别模型,所述角度识别模型包括特征提取层、特征融合层、特征转换层和分类层;基于所述角度识别模型输出的校正旋转角度对所述目标电子文件图像进行校正。采用上述方法可以自动地对电子文件进行旋转校正,提高用户的阅读体验。
技术领域
本申请涉及人工智能领域,特别涉及一种电子文件的旋转校正方法和装置。
背景技术
生活中,常常需要将一些纸质文件扫描并上传得到电子文件,以基于电子文件进行后续处理。然而,由于扫描、上传过程中可能会存在一些不规范的操作,导致得到的电子文件存在一定角度的旋转,如扫描时由于未水平/垂直放置导致纸质文件偏移了一定角度、上传时将竖向放置的文件设置为横向放置等,这些都会给阅读者带来不便。
发明内容
有鉴于此,本申请提供一种电子文件的旋转校正方法和装置。
具体地,本申请是通过如下技术方案实现的:
一种电子文件的旋转校正方法,包括:
获取待校正的目标电子文件图像;
将所述目标电子文件图像输入角度识别模型,所述角度识别模型包括特征提取层、特征融合层、特征转换层和分类层;
其中,所述特征提取层用于基于若干不同的特征提取方向对所述目标电子文件图像进行特征提取,得到各个特征提取方向对应的初始特征;
所述特征融合层用于将各个特征提取方向对应的初始特征进行融合,得到综合特征;
所述特征转换层用于将所述综合特征转换为若干个标准旋转角度对应的概率值,所述标准旋转角度的数量与角度识别精度正相关;
所述分类层用于基于各个标准旋转角度对应的概率值确定所述目标电子文件图像的校正旋转角度;
基于所述角度识别模型输出的校正旋转角度对所述目标电子文件图像进行校正。
一种电子文件的旋转校正装置,包括:
获取单元,用于获取待校正的目标电子文件图像;
输入单元,用于将所述目标电子文件图像输入角度识别模型,所述角度识别模型包括特征提取层、特征融合层、特征转换层和分类层;
其中,所述特征提取层用于基于若干不同的特征提取方向对所述目标电子文件图像进行特征提取,得到各个特征提取方向对应的初始特征;
所述特征融合层用于将各个特征提取方向对应的初始特征进行融合,得到综合特征;
所述特征转换层用于将所述综合特征转换为若干个标准旋转角度对应的概率值,所述标准旋转角度的数量与角度识别精度正相关;
所述分类层用于基于各个标准旋转角度对应的概率值确定所述目标电子文件图像的校正旋转角度;
校正单元,用于基于所述角度识别模型输出的校正旋转角度对所述目标电子文件图像进行校正。
本申请实施例中,可以将待校正的目标电子文件图像输入角度识别模型,利用角度识别模型从若干个特征提取方向对目标电子文件图像进行特征提取,并对提取得到的各个特征提取方向的特征进行融合,然后将融合后的特征转换为若干个标准旋转角度对应的概率值,基于这些概率值确定目标电子文件的校正旋转角度,按照校正旋转角度对目标电子文件图像进行旋转校正。采用上述方法可以自动地识别出目标电子文件图像的旋转角度并进行调整,不需要人工点击旋转按钮进行校正,可以大大地提高便利性和阅读体验。
附图说明
图1是本申请一示例性实施例示出的一种电子文件旋转的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于共道网络科技有限公司,未经共道网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011422419.8/2.html,转载请声明来源钻瓜专利网。