[发明专利]一种商品税收编码的获取方法在审
申请号: | 201810273206.X | 申请日: | 2018-03-29 |
公开(公告)号: | CN108491887A | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 李海波;陆军;李正 | 申请(专利权)人: | 安徽航天信息有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 230000 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发票数据 税收 编码数据 错误分类 分类效果 过程处理 同步程序 增量学习 准确性能 错误率 加载 去噪 引擎 噪声 采集 转换 分类 保证 | ||
1.一种商品税收编码的获取方法,其特征在于,所述获取方法包括以下步骤:
步骤一:数据同步:通过同步程序将电子底账中发票数据、商品税收编码数据同步至发票数据平台,每天同步新增数据;
步骤二:数据处理:对电子底帐中的数据进行采集、去噪、转换、加载过程处理;
步骤三:基于spark引擎进行模型在线增量学习。
2.根据权利要求1所述的一种商品税收编码的获取方法,其特征在于:所述步骤一中数据同步过程中,当模型成熟后停止数据同步,当编码有更新时开启数据同步。
3.根据权利要求1所述的一种商品税收编码的获取方法,其特征在于:所述步骤二的数据处理在特征选出上采用降维的方式降低特征维度,剔除一定到噪声,处理步骤如下:
第一步:构建商品词库,然后对发票商品名称进行智能分词;
第二步:统计词频计算;
第三步:实施特征哈希。
4.根据权利要求1所述的一种商品税收编码的获取方法,其特征在于:所述步骤三中在线增量学习的具体步骤为:
S1:以顺序的方式接收训练数据,然后学习第一批数据得到一个学习模型;
S2:得到第二批数据,依据模型或规则,做出决策,给出结果;
S3:根据真实的结果,修正模型权重向量W;
S4:然后再接收第三批数据,循环S2和S3步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽航天信息有限公司,未经安徽航天信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810273206.X/1.html,转载请声明来源钻瓜专利网。