[发明专利]一种数据处理方法及相关设备在审
申请号: | 201910990999.1 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110751088A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 张庆 | 申请(专利权)人: | 深圳金蝶账无忧网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 44285 深圳市深佳知识产权代理事务所(普通合伙) | 代理人: | 聂秀娜 |
地址: | 518057 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标图像 要素信息 发票 目标要素 详细信息 影像 图像 获取目标 模型识别 数据处理 申请 | ||
本申请实施例提供了一种数据处理方法及相关设备,不但可以识别影像质量较高的发票,同时也可以识别影像质量较低的发票,提高发票的识别效率,减少人工损耗。该方法包括:获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;根据所述多个要素信息确定所述目标图像的详细信息。
技术领域
本申请涉及信息处理领域,尤其涉及一种数据处理方法及相关设备。
背景技术
商务运动的发展催生了发票的迅速发展,用传统纸质发票记账需要手工输入发票信息,容易出错,处理需要消耗大量的人力和时间。
目前提供的大多数发票识别方式,均是基于光学字符识别(Optical CharacterRecognition,ORC)技术实现。ORC技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
但是通过这种方式对发票进行识别时,对待识别的发票图像质量有较高的要求,对清晰、完整以及无模糊污损的发票可以识别,但是对于影像质量不高的发票往往是无法识别的。
发明内容
本申请提供了一种数据处理方法及相关设备,不但可以识别影像质量较高的发票,同时也可以识别影像质量较低的发票,提高发票的识别效率,减少人工损耗。
本申请实施例第一方面提供一种数据处理方法,所述方法包括:
获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;
基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;
根据所述多个要素信息确定所述目标图像的详细信息。
可选地,所述多个要素信息包括号码要素信息、代码要素信息、日期要素信息以及第一类别要素信息,所述基于所述目标图像,通过要素识别模型识别所述目标图像对应的多个要素信息包括:
确定所述号码要素信息对应的号码截图、所述代码要素信息对应的代码截图、所述日期要素信息对应的日期截图以及所述第一类别要素信息对应的第一截图,所述号码截图、所述代码截图、所述日期截图以及所述第一截图均包含于所述目标图像;
基于所述号码截图、所述代码截图、所述日期截图以及所述第一截图,通过所述目标识别模型识别所述目标图像的号码信息、代码信息、日期信息以及第一类别信息,所述第一类别信息为所述目标图像中的校验码信息或所述目标图像中的不含税金额信息。
可选地,所述确定所述第一类别要素信息对应的第一截图包括:
确定所述目标图像中的特征截图;
基于所述特征截图,通过特征识别模型确定所述目标图像的类别,所述特征识别模型与所述特征截图相对应,所述第一类别信息与所述目标图像的类别相对应;
根据所述目标图像的类别确定所述第一截图。
可选地,所述获取目标图像包括:
接收终端发送的初始图像;
将所述初始图像转换为特定格式,得到所述目标图像。
可选地,所述将所述初始图像转换为特定格式,得到所述目标图像包括:
判断所述初始图像的高度是否大于所述初始图像的宽度;
若所述初始图像的高度大于所述初始图像的宽度,则将所述初始图像按照第一规则进行旋转得到第一图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳金蝶账无忧网络科技有限公司,未经深圳金蝶账无忧网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910990999.1/2.html,转载请声明来源钻瓜专利网。