[发明专利]一种人工智能发票识别方法及系统在审
申请号: | 202211022018.2 | 申请日: | 2022-08-25 |
公开(公告)号: | CN115393863A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 王赟瑄;吴梦瑶;谢昕;陈卓然 | 申请(专利权)人: | 王赟瑄 |
主分类号: | G06V30/18 | 分类号: | G06V30/18;G06V30/19;G06N3/04;G06N3/08 |
代理公司: | 北京春江专利商标代理事务所(普通合伙) 11835 | 代理人: | 向志杰 |
地址: | 211100 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人工智能 发票 识别 方法 系统 | ||
本发明提供一种人工智能发票识别方法及方法,属于人工智能识别技术领域。该方法包括:对输入发票图像进行灰度化处理得到第一图像并提取其中的连通域;将输入图像的色彩空间转换到HSV色彩空间,获取转换后的图像中每个像素点的H分量,并筛选出H分量在预设范围内的像素点区域,预设范围根据图形库中全部图形的颜色确定;计算连通域和像素点区域的交集,得到第二图像;分别对第二图像进行宽度和高度上的缩放,使得第二图像的高或宽调整至预设尺寸;利用神经网络对尺寸调整后的第二图像进行图形识别,识别结果包括识别到的图形或未识别到图形。本发明利用神经网络对发票进行智能识别,能够降低发票中图形、文字识别的计算量并提高识别精度。
技术领域
本发明涉及人工智能识别技术领域,具体涉及一种人工智能发票识别方法及系统。
背景技术
图形的识别属于图像识别中非常重要的一类,其主要应用在特殊的工程,这些应用领域主要包括电子电路中的电子器件图形识别、工程图纸和建筑图纸中的图形识别、数学表达式图形识别、音乐符号的图形识别、地图图形识别等,但还未见对发票中的图形、文字识别的报告。
发明内容
因此,本发明提供一种人工智能发票识别方法及系统,能够降低发票中图形、文字识别的计算量并提高识别精度。
为此,本发明提供一种人工智能图形识别方法,包括以下步骤:
对输入图像进行灰度化处理得到第一图像,提取所述第一图像中的连通域;
将所述输入图像的色彩空间转换到HSV色彩空间,获取转换后的图像中每个像素点的H分量,并从转换后的图像中筛选出H分量在预设范围内的像素点区域,所述预设范围根据图形库中全部图形的颜色确定;
计算所述连通域和所述像素点区域的交集,得到第二图像;
分别对所述第二图像进行宽度和高度上的缩放,使得所述第二图像的高或宽调整至预设尺寸,所述预设尺寸根据图形库中图形的标准尺度确定;
利用神经网络对尺寸调整后的所述第二图像进行图形识别,识别结果包括识别到的图形或未识别到图形,所述识别到的图形为所述图形库中的一个。
可选的,所述利用神经网络对尺寸调整后的所述第二图像进行图形识别之后,还包括:
按照预设采样规则对尺寸调整后的所述第二图像进行采样;
确定所述第二图像中每两个采样点之间的第一距离和第一角度;
获取所述识别到的图形中按照所述预设采样规则进行采样后得到的每两个采样点之间的第二距离和第二角度;
分别计算所述第二图像中和所述识别到的图形中对应的两个采样点之间的所述第一距离和所述第二距离的第一差值、所述第一角度和所述第二角度的第二差值;
根据所述第一差值计算距离方差、根据所述第二差值计算角度方差;
若所述距离方差和所述角度方差均小于预设阈值,则对所述识别结果进行确认;
其中,所述预设采样规则与所述识别到的图形对应,所述预设采样规则包括以下至少之一:对图形中与预设线条相交的点中最左侧的点进行采样、对图形中与预设线条相交的点中最右侧的点进行采样、对图形中与预设线条相交的点中最上侧的点进行采样、对图形中与预设线条相交的点中最下侧的点进行采样;
所述预设线条在所述图形中的相对位置固定。
可选的,所述对输入图像进行灰度化处理得到第一图像,提取所述第一图像中的连通域之前,还包括:
对所述输入图像进行高斯滤波处理;
对滤波后的所述输入图像进行边缘增强处理;
对边缘增强后的所述输入图像进行带通滤波。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王赟瑄,未经王赟瑄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211022018.2/2.html,转载请声明来源钻瓜专利网。