[发明专利]一种发票目标区域的定位方法、装置、设备及介质在审
申请号: | 202010010700.4 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111241966A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 黎贤钊;张学习;彭健彬 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06N3/04;G06T3/40;G06T5/00;G06T7/90;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 黄忠 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发票 目标 区域 定位 方法 装置 设备 介质 | ||
1.一种发票目标区域的定位方法,其特征在于,包括:
获取待测图像;
将所述待测图像输入到训练好的神经网络中,对所述待测图像中的目标区域进行检测;
若存在所述目标区域,则对所述目标区域进行定位;
对所述定位的目标区域进行分类,得到分类后的目标区域的图像坐标。
2.根据权利要求1所述的发票目标区域的定位方法,其特征在于,在将所述待测图像输入到训练好的神经网络中,对所述待测图像中的目标区域进行检测之前,还包括:
将所述待测图像进行图像尺度归一化处理,使得所述待测图像输出为满足神经网络输入尺寸的图像。
3.根据权利要求2所述的发票目标区域的定位方法,其特征在于,所述将所述待测图像进行图像尺度归一化处理,使得所述待测图像输出为满足神经网络输入尺寸的图像具体为:
采用双线性插值法对所述待测图像进行图像尺度归一化处理,使得所述待测图像输出为满足神经网络输入尺寸的图像。
4.根据权利要求1所述的发票目标区域的定位方法,其特征在于,所述将所述待测图像输入到神经网络中对图像中的目标区域进行检测具体为:
将所述待测图像输入到Darknt52网络中对图像中的目标区域进行检测。
5.根据权利要求1所述的发票目标区域的定位方法,其特征在于,所述对目标区域进行定位具体为:
采用多检测尺度的方法对图像的目标区域进行坐标预测,选择置信度最高的检测框作为定位结果。
6.根据权利要求1所述的发票目标区域的定位方法,其特征在于,所述对所述定位的目标区域进行分类,并得到分类后的目标区域的图像坐标具体为:
将发票的每一个特定区域作为一个类别,采用多个与所述类别对应的逻辑回归函数,对所述定位的目标区域进行分类。
7.一种发票目标区域的定位装置,其特征在于,包括:
图像获取单元,所述图像获取单元用于获取待测图像;
区域检测单元,所述区域检测单元用于将所述待测图像输入到训练好的神经网络中,对所述待测图像中的目标区域进行检测;
区域定位单元,所述区域定位单元用于当存在所述目标区域时,对所述目标区域进行定位;
区域分类单元,所述区域分类单元用于对所述定位的目标区域进行分类,并得到分类后的目标区域的图像坐标。
8.根据权利要求7所述的一种发票目标区域的定位装置,其特征在于,还包括:
归一化单元,所述归一化单元用于将所述待测图像进行图像尺度归一化处理,使得所述待测图像输出为满足神经网络输入尺寸的图像。
9.一种发票目标区域的定位设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-6任一项所述的发票目标区域的定位方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-6任一项所述的发票目标区域的定位方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010700.4/1.html,转载请声明来源钻瓜专利网。