[发明专利]基于电子文件进行报告的系统和方法在审
申请号: | 201780060462.4 | 申请日: | 2017-08-04 |
公开(公告)号: | CN109791540A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | N·古兹曼;I·萨夫特 | 申请(专利权)人: | 瓦特博克有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06Q20/38 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑勇 |
地址: | 以色列*** | 国省代码: | 以色列;IL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子文件 费用项目 电子文件模板 交易参数 结构化数据 报告指示 非结构化 匹配 检索 创建 分析 | ||
一种基于第一电子文件和至少一个第二电子文件进行报告的方法和系统。该方法包括分析该第一电子文件,以确定至少一个费用项目中每一个的至少一个交易参数,该第一电子文件指示该至少一个费用项目,其中该第一电子文件包括至少部分非结构化的数据;为该第一电子文件创建至少一个模板,其中每个第一电子文件模板为包括所确定的至少一个交易参数的结构化数据集;基于该至少一个第一电子文件模板检索该至少一个第二电子文件;以及当该至少一个第二电子文件与该至少一个费用项目匹配时生成报告,其中该报告指示该至少一个费用项目并包括该至少一个第二电子文件。
相关申请的交叉引用
本申请要求于2016年8月5日提交的、序列号为62/371,233的美国临时申请的优先权。本申请同时也是于2016年11月28日提交的、序列号为15/361,934的待决美国专利申请的部分延续案。上述申请的内容通过引用并入本文。
技术领域
本发明总体上涉及分析电子文件,更具体地涉及对非结构化的电子文件进行情景分析。
背景技术
客户可以通过网络实时向商家订购旅游和住宿等服务。这些订单可以立即被接收和处理。然而,订单的付款通常需要更多的时间来完成,特别是需要更多的时间来确保正在转移的资金的安全。因此,商家通常要求客户在下订单时提供实时的付款保证。例如,客户可以依照支付输入信用卡信息,并且商家可以在授权出售之前实时地验证信用卡信息。验证通常包括确定所提供的信息是否有效(即,信用卡号码、有效日期、密码和/或客户名称是否跟已知信息相匹配)。
在收到这样的保证后,可以为客户生成一份订购单。订购单提供了该订单的证明,例如,购买价格、订购的货物和/或服务等。稍后,可能会生成订单的发票。虽然订购单通常用来指示需要哪些产品以及对价格的估计或报价,但发票通常用来指示实际提供了哪些产品以及产品的最终价格。通常,订单的发票所显示的购买价格与订购单所显示的购买价格不同。例如,如果一位住在酒店的客人最初订了3晚的住宿,但最后却住了第四晚,那么订购单的总价格可能会与随后的发票上的总价格不同。对于发票总价格与订购单总价格不同的情况很难跟踪,特别是在大型企业每天接收许多订单的情况下(例如,在给定国家中的管理着数百家或数千家酒店的大型连锁酒店)。这些价格差异可能会导致企业的记录出现错误。
随着企业越来越多地依靠技术来管理与发票和订购单数据等业务有关的数据,用于适当地管理和验证数据的合适系统已成为成功的关键。特别是对于大型企业来说,企业每天使用的数据量可能是巨大的。因此,人工审查和验证这些数据是不现实的。然而,记录文件之间的差异可能给企业造成重大问题,例如,未能向税务局适当地报告收入。
一些解决方案用于自动识别扫描文件(如发票和收据)或其他非结构化电子文件(例如,非结构化的文本文件)中的信息。在准确地辨认和识别电子文件的字母和其他特征这些方面,这种解决方案常常面临挑战。此外,输入的非结构化电子文件的内容质量下降通常会导致较高的错误率。因此,现有的图像识别技术在理想情况下(即非常清晰的图像)并不完全准确,而且当输入图像不太清晰时,这些技术的准确性往往会急剧下降。此外,丢失或其他不完整的数据可能导致在随后使用数据时出现错误。许多现有解决方案无法识别丢失的数据,除非,例如结构化数据集中的字段是不完整的。
此外,现有的图像识别解决方案可能无法准确地识别某些或全部特殊字符(例如“!”“@”“#”“$”“%”“&”等。例如,一些现有的图像识别解决方案可能不准确地将扫描收据中的破折号识别为数字“1”。在另一示例中,一些现有的图像识别解决方案不能识别诸如美元符号、日元符号等的特殊字符。
此外,在准备识别资料以供后续使用的方面,这些解决方案可能面临挑战。具体来说,许多这样的解决方案要么以非结构化格式生成输出,要么只能在输入电子文件被具体格式化以供图像识别系统识别的情况下才能生成结构化输出。生成的非结构化输出通常无法被有效处理。特别地,这种非结构化输出可能包含重复项,并且可能包括在使用前需要后续处理的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瓦特博克有限公司,未经瓦特博克有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780060462.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子文件格式修改和优化
- 下一篇:日志序列号生成方法、装置及可读存储介质