[发明专利]一种基于发票采集系统的发票校验方法在审
申请号: | 202111183706.2 | 申请日: | 2021-10-11 |
公开(公告)号: | CN113903118A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 张盛;张辉;张敏;王晓;王熹;李科维;张晓雪 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G07D7/20 | 分类号: | G07D7/20 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 刘小莉 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 发票 采集 系统 校验 方法 | ||
1.一种基于发票采集系统的发票校验方法,其特征在于:包括,
采集电子发票原始文件,提取电子发票票面信息;
根据提取到的电子发票票面信息对采集到的电子发票进行原始凭证校验、真伪校验;
进行电子发票重复报销校验;
建立发票数据池,标记发票报销状态。
2.根据权利要求1所述的基于发票采集系统的发票校验方法,其特征在于:所述采集电子发票原始文件,提取电子发票票面信息包括:
根据发票规格预先设置发票票面各内容信息的位置,对各内容信息位置进行原始标记,通过OCR识别对电子发票原始文件影像进行预处理,并对电子发票原始文件影像进行识别,提取采集到的电子发票原始文件影像的发票票面内容信息,并对所述发票票面内容信息的位置进行后期标记,所述电子发票票面信息还包括票面长度、票面宽度、字高、字宽、字体间距、发票代码、发票号码。
3.根据权利要求2所述的基于发票采集系统的发票校验方法,其特征在于:所述原始凭证校验包括:
所述发票票面内容信息的位置标记为矩形框,获取N组后期标记,并进一步确定所述后期标记的中心点,所述中心点的数量为N,随机选取M个中心点,1MN,并根据中心点所对应的票面内容信息获取相应的原始标记的位置信息,计算选取的中心点两两之间的距离,并计算所述距离与对应的原始标记中心点两两之间的原始距离的差值,所述差值为{L1、L2、L3、…、Lm-1、Lm},进一步对所述差值进行平均值计算,所述平均值为第一差值平均值,当所述第一差值平均值大于等于第一预设值时,所述原始凭证校验失败。
4.根据权利要求3所述的基于发票采集系统的发票校验方法,其特征在于:所述原始凭证校验还包括:
进一步获取所述票面长度D0、票面宽度W0、字高H、字宽W1、字体间距D1,计算得到S1=D0×W0、S2=H×W1、S3=[D1×(n-1)+n*W1]×H的值,其中,S1为票面面积,S2为字体面积,S3为后期标记的矩形框面积,n为一个矩形框中的文字数量,并求取S3与其各自对应的原始标记的矩形框面积的差值平均值,所述差值平均值为第二差值平均值,计算票面面积、字体面积、第二差值平均值与各自对应阈值的差值,当任一差值大于等于第二预设值时,所述原始凭证校验失败。
5.根据权利要求4所述的基于发票采集系统的发票校验方法,其特征在于:所述真伪校验包括:
根据各原始标记的中心点位置确定发票代码、发票号码于所述电子发票原始文件影像中的后期标记位置,对所述发票代码、发票号码进行识别获取,通过与发票查验平台进行数据交互,对所述电子发票原始文件进行真伪校验。
6.根据权利要求5所述的基于发票采集系统的发票校验方法,其特征在于:所述电子发票重复报销校验包括:
根据各原始标记的中心点位置确定发票号码于所述电子发票原始文件影像中的后期标记位置,提取所述发票号码内容信息,并将所述发票号码内容信息与已上传的发票号码进行比对,若比对成功,则当前为重复报销,平台进行预警。
7.根据权利要求6所述的基于发票采集系统的发票校验方法,其特征在于:所述电子发票重复报销校验还包括:
通过识别提取到发票号码内容信息,并按照次序对所述发票号码数字进行排序,随机获取k0个位置上的发票号码数字,其中1k08,并建立发票号码数字与排序位置的对应关系,生成待比对数据集,所述待比对数据集包括发票号码数字、对应排序位置,并根据所述待比对数据集与已上传的发票号码的比对结果,判断当前是否为重复报销。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111183706.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预塑封半导体封装支架制备方法
- 下一篇:一种活性氧化铁脱硫剂及其制备方法