[发明专利]基于深度学习的图像校正方法及系统在审
申请号: | 202011241410.7 | 申请日: | 2020-11-09 |
公开(公告)号: | CN114119379A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 李冠德;黄名嘉;林宏轩;李宇哲;罗佳玲 | 申请(专利权)人: | 财团法人工业技术研究院 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 徐协成 |
地址: | 中国台*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 图像 校正 方法 系统 | ||
1.一种基于深度学习的图像校正方法,包括:
通过深度学习模型接收具有至少一字的图像,并根据该图像产生透视变换矩阵;
根据该透视变换矩阵对该图像执行透视变换,以获得包含该至少一字的正面视角的校正图像;
根据该图像产生包含该至少一字的正面视角的最佳校正图像;
获得对应该图像与该最佳校正图像的最佳透视变换矩阵;
计算该最佳透视变换矩阵与该透视变换矩阵之间的损失值;以及
使用该损失值更新该深度学习模型。
2.如权利要求1所述的图像校正方法,其中在根据该图像产生包含该至少一字的正面视角的该最佳校正图像的步骤中包括:
标记该图像,该标记具有涵盖该至少一字的标记范围。
3.如权利要求1所述的图像校正方法,其中还包括:
当标记范围无法涵盖该至少一字时,延伸该图像以获得延伸图像;以及
标记该延伸图像,使该标记范围涵盖该至少一字。
4.如权利要求1所述的图像校正方法,其中还包括:
通过图像提取单元提取该图像;以及
根据该图像提取单元的拍摄信息限缩该透视变换矩阵的多个透视变换参数。
5.如权利要求4所述的图像校正方法,其中该拍摄信息包括拍摄位置、拍摄方向及拍摄角度。
6.一种基于深度学习的图像校正系统,包括:
深度学习模型,接收具有至少一字的图像,并根据该图像产生透视变换矩阵;
处理单元,接收该图像及该透视变换矩阵,并根据该透视变换矩阵对该图像执行透视变换,以获得包含该至少一字的正面视角的校正图像;以及
模型调整单元,接收该图像、根据该图像产生包含该至少一字的正面视角的最佳校正图像、获得对应该图像与该最佳校正图像的最佳透视变换矩阵、计算该最佳透视变换矩阵与该透视变换矩阵之间的损失值、并使用该损失值更新该深度学习模型。
7.如权利要求6所述的图像校正系统,其中该模型调整单元还标记该图像,该标记具有涵盖该至少一字的标记范围。
8.如权利要求6所述的图像校正系统,其中当标记范围无法涵盖该至少一字时,该模型调整单元还延伸该图像以获得延伸图像,并标记该延伸图像,使该标记范围涵盖该至少一字。
9.如权利要求6所述的图像校正系统,其中还包括:
图像提取单元,用以提取该图像;
其中该处理单元根据该图像提取单元的拍摄信息限缩该透视变换矩阵的多个透视变换参数。
10.如权利要求9所述的图像校正系统,其中该拍摄信息包括拍摄位置、拍摄方向及拍摄角度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011241410.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:流量监控方法、装置、集成电路及网络设备
- 下一篇:四季胶带
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序