[发明专利]一种基于LSTM的智能导税模型构建方法及装置在审
申请号: | 202011008803.3 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112257842A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 杨为琛;伺彦伟;张婷;祁洪波;马军肖;魏荣祁;申永利;何武;张运波 | 申请(专利权)人: | 河北航天信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q40/00 |
代理公司: | 天津合正知识产权代理有限公司 12229 | 代理人: | 李成运;石熠 |
地址: | 050000 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lstm 智能 模型 构建 方法 装置 | ||
1.一种基于LSTM的智能导税模型构建方法,其特征在于,包括:
S1、读取办税人员历史办税业务数据;
S2、特征处理,按时间先后整理涉税行为,对特征进行补零化;
S3、将处理完的纳税人行为特征数据分为训练集与测试集;
S4、将训练集作为LSTM模型的输入,使用LSTM模型进行训练,输入数据通过输入门、遗忘门和输出门,得到模型训练后的结果;
S5、将训练好的LSTM模型应用到划分的测试集上,进行预测。
2.根据权利要求1所述的一种基于LSTM的智能导税模型构建方法,其特征在于,步骤S2中所述特征处理的具体方法为:
S201、将历史办税业务数据作为训练数据,生成历史办税行为记录序列,以时间发生前后为排列规则;
S202、每个纳税人从注册开始办税行为整理为一条时间序列数据;
S203、所述时间序列数据设有最长序列限制,长度不满足最长序列限制的序列数据,进行前补零处理。
3.根据权利要求1所述的一种基于LSTM的智能导税模型构建方法,其特征在于,步骤S3中,特征数据划分训练集与测试集的比例为7:3。
4.根据权利要求1所述的一种基于LSTM的智能导税模型构建方法,其特征在于,步骤S4中,将当下时刻的税务行为作为现阶段输入Xt,将前一个时刻税务行为经过前一个神经单元处理后的值作为为上阶段输出Ht-1,上阶段存储状态为Ct-1,当下时刻某一点的税务行为经过此神经单元处理的值作为现阶段输出Ht,现阶段的存储状态为Ct。
5.一种基于LSTM的智能导税模型构建装置,其特征在于,包括:
读取模块,用于读取办税人员历史办税业务数据;主要包括从登记业务、社保业务、申报缴税等方向提取纳税人的历史业务数据;
特征处理模块,用于办税业务数据的特征处理,按时间先后整理涉税行为,对特征进行补零化;
划分模块,用于将处理完的纳税人行为特征数据分为训练集与测试集;
训练模块,用于将训练集作为LSTM模型的输入,使用LSTM模型进行训练,输入数据通过输入门、遗忘门和输出门,得到模型训练后的结果;
预测模块,用于将训练好的LSTM模型应用到划分的测试集上,进行预测。
6.根据权利要求5所述的一种基于LSTM的智能导税模型构建装置,其特征在于,所述特征处理模块包括:
序列生成单元,用于将历史办税业务数据作为训练数据,生成历史办税行为记录序列,以时间发生前后为排列规则;
纳税人整理单元,用于将每个纳税人从注册开始办税行为整理为一条时间序列数据;
补零化单元,所述时间序列数据设有最长序列限制,长度不满足最长序列限制的序列数据,进行前补零处理。
7.根据权利要求5所述的一种基于LSTM的智能导税模型构建装置,其特征在于,所述划分模块将特征数据划分训练集与测试集的比例为7:3。
8.根据权利要求5所述的一种基于LSTM的智能导税模型构建装置,其特征在于,所述训练模块中,将当下时刻的税务行为作为现阶段输入Xt,将前一个时刻税务行为经过前一个神经单元处理后的值作为为上阶段输出Ht-1,上阶段存储状态为Ct-1,当下时刻某一点的税务行为经过此神经单元处理的值作为现阶段输出Ht,现阶段的存储状态为Ct。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北航天信息技术有限公司,未经河北航天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011008803.3/1.html,转载请声明来源钻瓜专利网。