[发明专利]一种业务报表纠错方法在审
申请号: | 201910601980.3 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110297833A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 刘冬 | 申请(专利权)人: | 税安科技(杭州)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06K9/62 |
代理公司: | 北京世誉鑫诚专利代理事务所(普通合伙) 11368 | 代理人: | 孙国栋 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征库 字段 纠错 机器学习模型 报表处理 报表数据 用户上传 预设 科目 分析 | ||
本发明公开的业务报表数据纠错方法,涉及业务报表处理技术领域,利用机器学习模型,对用户上传的业务报表进行分析并处理,得到业务报表各个科目对应字段的特征,生成第一特征库,将第一特征库中各个字段与预设的第二特征库中的各个字段一一对比,判断第一特征库与第二特征库是否存在不相同的字段,提高了纠错的准确性及效率。
技术领域
本发明涉及业务报表处理技术领域,具体涉及一种业务报表纠错方法。
背景技术
目前,由于各种业务报表(例如:资产负债表、利润表、增值税表、所得税表、自定义表)的版本不一,导致软件程序分析难度加大。以财务报表为例,每年税务局也会对原有报表进行修改,加大了对用户输入的业务报表数据纠错的难度。
发明内容
为解决现有技术的不足,本发明实施例提供了一种业务报表纠错方法,该方法包括以下步骤:
利用机器学习模型,对用户上传的业务报表进行分析并处理,得到业务报表各个科目对应字段的特征,生成第一特征库;
将第一特征库中各个字段与预设的第二特征库中的各个字段一一对比,判断所述第一特征库与所述第二特征库是否存在不相同的字段,若是,则提醒用户更改所述字段并提供所述字段对应的标准字段供用户选择。
优选地,所述第二特征库的生成过程包括:
从网络资源中获取海量业务报表并利用机器学习模型,提取海量业务报表中各个科目对应字段的特征,生成第二特征库。
优选地,对用户上传的业务报表进行分析并处理包括:
删除业务报表各个科目中的特殊字符,其中,所述特殊字符包括标点符号。
优选地,判断所述第一特征库与所述第二特征库是否存在不相同的字段包括:
获取所述第一特征库中各个科目对应的第一字段及所在的列位置;
根据所述列位置,确定各个科目在所述第二特征库中所对应的第二字段;
判断所述第一字段与所述第二字段是否相同,若否,则确定所述第一特征库与所述第二特征库存在不相同的字段。
本发明实施例提供的业务报表数据纠错方法具有以下有益效果:
通过搜集海量业务报表的各个科目对应字段的特征,同时根据用户上传的业务报表数据进行分析比对,如果发现不匹配或者错误的业务报表数据,对用户进行友好提示,同时为防止数据误操作,需要用户手动进行确认,提高了纠错的准确性及效率。
附图说明
图1为本发明实施例提供的业务报表纠错方法流程示意图;
图2为采用本发明实施例提供的业务报表纠错方法生成的系统提示界面示意图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
参见图1,本发明实施例提供的业务报表数据纠错方法包括以下步骤:
S101,利用机器学习模型,对用户上传的业务报表进行分析并处理,得到业务报表各个科目对应字段的特征,生成第一特征库。
S102,将第一特征库中各个字段与预设的第二特征库中的各个字段一一对比,判断第一特征库与第二特征库是否存在不相同的字段,若是,则提醒用户更改该字段并提供字段对应的标准字段供用户选择。
可选地,第二特征库的生成过程包括:
从网络资源中获取海量业务报表并利用机器学习模型,提取海量业务报表中各个科目对应字段的特征,生成第二特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于税安科技(杭州)有限公司,未经税安科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910601980.3/2.html,转载请声明来源钻瓜专利网。