[发明专利]图像清晰度检测方法、装置、设备及存储介质在审
申请号: | 202110304049.6 | 申请日: | 2021-03-22 |
公开(公告)号: | CN113066059A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 洪叁亮;梁俊杰;赖众程 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518001 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 清晰度 检测 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能领域,公开了一种图像清晰度检测方法、装置、设备及存储介质。图像清晰度检测方法包括:获取待检测的图像;采用预置场景文本检测模型对所述图像进行文字区域定位,输出所述图像中各文字所在区域对应的文字区域框;从所述图像中裁取所述各文字区域框对应的文字区域;基于无参考离散余弦变换域,对所述文字区域对应的空域进行变换,得到所述文字区域对应的频域图像;根据所述频域图像,采用预置文本清晰度计算公式,计算所述各文字区域的清晰度;根据所述各文字区域的清晰度,计算所述图像的综合清晰度。本发明可以高效且精准的检测图像的清晰度。
技术领域
本发明涉及人工智能领域,尤其涉及一种图像清晰度检测方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展,用户在线上即可办理相关业务。其中资产证明图像是客户提交给银行的一种个人资产证明,银行生产环境在线上对其进行光学字符识别,获取相关的资产信息,给用户和银行工作人员提供了极大地便利。
但是在实际情况中,客户上传的资产证明图像数据各式各样,质量参差不齐,其中不乏含有模糊的资产证明图像,这给资产证明光学字符识别带来了困难和资源浪费。在现有技术中,对图像清晰度计算的方法仍存在图像拍摄环境多种多样的不利因素,容易导致清晰度评价误判,鲁棒性不好的情况。如何实现准确地对复杂多样的图像进行清晰度计算成为一个问题。
发明内容
本发明的主要目的在于解决图像清晰度检测准确度不高的问题。
本发明第一方面提供了一种图像清晰度检测方法,包括:
获取待检测的图像;
采用预置场景文本检测模型对所述图像进行文字区域定位,输出所述图像中各文字所在区域对应的文字区域框;
从所述图像中裁取所述各文字区域框对应的文字区域;
基于无参考离散余弦变换域,对所述文字区域对应的空域进行变换,得到所述文字区域对应的频域图像;
根据所述频域图像,采用预置文本清晰度计算公式,计算所述各文字区域的清晰度;
根据所述各文字区域的清晰度,计算所述图像的综合清晰度。
可选的,在本发明第一方面的第一种实现方式中,所述场景文本检测模型依次包括:PVAnet网络、特征合并层、网络输出层,所述采用预置场景文本检测模型对所述图像进行文字区域定位,输出所述图像中各文字所在区域对应的文字区域框包括包括:
在所述PVAnet网络中,将所述图像输入所述PVAnet网络进行特征提取,得到不同尺寸的多个第一特征图;
在所述特征合并层的多个第一反卷积层中,使用多个第一反卷积核,对所述不同尺寸的各第一特征图进行上采样并向下合并,得到对应的多个第二特征图;
在所述网络输出层的第一池化层中,使用第一池化卷积核,对所述各第二特征图进行线性变换计算,得到对应的多个文字区域框。
可选的,在本发明第一方面的第二种实现方式中,所述PVAnet网络依次包括:激活层、Inception网络、HyperNet网络,所述将所述图像输入所述PVAnet网络进行特征提取,得到不同尺寸的多个第一特征图包括:
在所述激活层的第一卷积层中,使用C.ReLU激活函数及第一卷积核,对所述图像进行非线性映射计算及卷积操作,得到对应的多个第一卷积特征图;
在所述Inception网络的多个第二卷积层中,使用大小不同的多个第二卷积核,对所述各第一卷积特征图进行不同的卷积操作,得到对应不同尺寸的多个第二卷积特征图;
在所述HyperNet网络的多个第三卷积层中,使用第三卷积核,对所述不同尺寸的各第二卷积特征图进行线性插值上采样及特征图融合,得到不同尺寸的多个第一特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304049.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序