[发明专利]基于电子文件进行报告的系统和方法在审
申请号: | 201780060462.4 | 申请日: | 2017-08-04 |
公开(公告)号: | CN109791540A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | N·古兹曼;I·萨夫特 | 申请(专利权)人: | 瓦特博克有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06Q20/38 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑勇 |
地址: | 以色列*** | 国省代码: | 以色列;IL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子文件 费用项目 电子文件模板 交易参数 结构化数据 报告指示 非结构化 匹配 检索 创建 分析 | ||
1.一种基于第一电子文件和至少一个第二电子文件进行报告的方法,包括:
分析所述第一电子文件,以确定至少一个费用项目中每一个的至少一个交易参数,所述第一电子文件指出所述至少一个费用项目,其中所述第一电子文件包括至少部分非结构化的数据;
为所述第一电子文件创建至少一个模板,其中每个第一电子文件模板为包括确定的至少一个交易参数的结构化数据集;
基于所述至少一个第一电子文件模板取回所述至少一个第二电子文件;以及
当所述至少一个第二电子文件与所述至少一个费用项目匹配时生成报告,其中所述报告指示所述至少一个费用项目并且所述报告包括所述至少一个第二电子文件。
2.根据权利要求1所述的方法,其中确定至少一个交易参数还包括:
在所述第一电子文件中识别至少一个关键字段和至少一个值;
基于所述第一电子文件创建数据集,其中创建的数据集包括所述至少一个关键字段和所述至少一个值;以及
分析所述创建的数据集,其中基于所述分析确定至少一个交易参数。
3.根据权利要求2所述的方法,其中识别所述至少一个关键字段和至少一个值还包括:
分析所述第一电子文件以确定所述第一电子文件中的数据;
基于预定义的关键字段列表,提取确定的数据的至少一部分,其中所述确定的数据的至少一部分与所述预定义的关键字段列表中的至少一个关键字段相匹配。
4.根据权利要求3所述的方法,其中分析所述第一电子文件还包括:
对所述第一电子文件执行光学字符识别。
5.根据权利要求4所述的方法,还包括:
对提取的确定的数据的至少一部分执行洁净处理。
6.根据权利要求1所述的方法,还包括:
为所述至少一个第二电子文件中的每一个创建模板,其中每个第二电子文件模板为包括各自的第二电子文件的数据的结构化数据集;
将所述至少一个第一电子文件模板与所述至少一个第二电子文件模板进行比较,其中当所述至少一个第一模板与高于一预定阈值的至少一个第二模板匹配时,所述至少一个第二电子文件与所述至少一个费用项目匹配。
7.根据权利要求6所述的方法,其中将至少一个第一电子文件模板和至少一个第二电子文件模板进行比较进一步包括:
将第一电子文件模板的至少一部分与所述至少一个第二电子文件模板的相应部分进行比较。
8.根据权利要求1所述的方法,其中所述第一电子文件为费用报告电子文件,其中每个第二电子文件为显示出以下至少一项的图像:发票、收据和采购号码记录。
9.根据权利要求1所述的方法,其中所述至少一个交易参数包括费用金额和费用描述,其中,当所述费用金额等于所述至少一个第二电子文件中指示的总金额时,所述至少一个第二电子文件与所述第一电子文件匹配。
10.一种非暂时性计算机可读介质,具有存储在其上的指令,所述指令致使一处理电路执行基于第一电子文件和至少一个第二电子文件进行报告的处理,所述处理包括:
分析所述第一电子文件,以确定至少一个费用项目中每一个的至少一个交易参数,所述第一电子文件指示所述至少一个费用项目,其中所述第一电子文件包括至少部分非结构化的数据;
为所述第一电子文件创建至少一个模板,其中每个第一电子文件模板为包括确定的至少一个交易参数的结构化数据集;
基于所述至少一个第一电子文件模板取回所述至少一个第二电子文件;以及
当所述至少一个第二电子文件与所述至少一个费用项目匹配时生成报告,其中所述报告指示所述至少一个费用项目并包括所述至少一个第二电子文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瓦特博克有限公司,未经瓦特博克有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780060462.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子文件格式修改和优化
- 下一篇:日志序列号生成方法、装置及可读存储介质