[发明专利]一种基于机器学习对企业所得税风险评估的方法在审
申请号: | 202110518344.1 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113205271A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 王心慧;齐艳红;徐夫田;马路军;李崇西;徐俊荣;张鹏;汤荣志;隋同兵;李思宏 | 申请(专利权)人: | 国家税务总局山东省税务局;济南中智亚信信息技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 闫露露 |
地址: | 250000 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 企业所得税 风险 评估 方法 | ||
本发明属于计算机技术领域,具体涉及一种基于机器学习对企业所得税风险评估的方法。具体包括:首先规划机器学习数据集的属性集合,根据企业所得税的管理特点从属性集中选择机器学习的290个目标集合;对数据分类抽取,按照不同属性所在的系统和表单进行分类各自抽取数据;再后数据按户归集形成机器学习最终的数据集;选择决策树和支持向量机算法模型进行集成和联接,形成适应于所得税的机器学习算法模型;最终运算输出结果和结果核实反馈。本发明的有益效果是:通过两种模型结合起来以发挥各自的优势,从大数据中发现规律,用于企业所得税的风险评估,达到很好的效果;充分的运用了大数据平台的并行和分布的优势,更佳的高效。
技术领域
本发明属于计算机技术领域,具体涉及一种基于机器学习对企业所得税风险评估的方法。
背景技术
在税务系统,企业所得税的管理是税收监管中的重点也是难点。企业缴纳企业所得税是以企业最终的企业应纳税所得额为计税依据,这涉及到企业的经营收入、成本、费用等各个方面,可是说,企业所得税涉及到企业的各个方面。当前企业所得税的管理模式是:企业每个季度自行省报预缴,年底实施汇算清缴。企业每年度向税务系统报送的汇算清缴表40多张表。税务系统除了收到企业所得税的这项相关系统,还采集到其他各种涉税信息(如:登记信息、企业财务报表、企业缴纳其他税费数据、企业开具发票和外部门涉税数据等各类信息),以反映出税务系统已归集了涉税大数据信息。如何利用这些涉税大数据利用技术手段加强税收监管,特别是企业所得税的监管是税务系统需要解决的问题。
传统的数据分析手段是:基于业务人员的税收业务知识形成分析指标形式的业务需进行技术实现,数据按照不同指标按照不同维度交叉分析,在此基础上,利用统计方法进行各种比对分析。这种分析是非常有用的,能揭示一些数据的直观信息。但这种的方法有几个缺点:一是只能反映数据的某个局部的情况,不能给出数据的全貌;二是不能充分利用大数据的‘大’和‘全’的特性,揭示他们内在的关系和规律(一半是非线性的);三是分析结果对数据质量的波动非常敏感,分析结果利用效果不是很好。
随着云计算和人工智能的发展,数据科学这门综合学科体现了未来的发展前景。本发明利用一种机器学习技术对涉税数据进行特征的提取,然后利用大数据平台的并行计算能力和算法模型从这些数据中找到有价值的内容和规律,针对企业所得税的风险评估提供很有成效的支持。
发明内容
为了解决上述的企业所得税税务风险指向性不强和评估效率不高的问题。本发明公开了面向税务领域的一种基于机器学习对企业所得税风险评估的方法。其中对于机器学习模型的构建方法采取税收业务专家知识和机器学习结合的方式。具体方案如下:
一种基于机器学习对企业所得税风险评估的方法,包括:
规划构建机器学习的属性集和目标集;
对所述属性集和所述目标集进行分类抽取、归集,形成数据集A并储到数据库Greenplum中,将所述数据集A合并形成二维数组;
将所述二维数组输入多个决策树模型进行运算,得出数据集B;
将所述数据集B和所述二维数组输入支持向量机模型进行运算,得出数据集C,并储到数据库Greenplum中;
将储到数据库Greenplum的所述数据集C按照业务规则进行展示。
作为本发明实施例的一种优选技术方案,所述属性集被定义为D={X1,X2,…,Xm},表示m个企业的按年归集数据,其中m根据被评估的行业所确定的纳税户数而确定,所述企业的按年归集数据可表示为Xi={xi1,xi2,…,xid},其中d为企业所得税的特性,包括登记类12个、征收类4个、申报类4个、财务报表类69个、汇算清缴年度报表类1773个,故d=1862。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家税务总局山东省税务局;济南中智亚信信息技术有限公司,未经国家税务总局山东省税务局;济南中智亚信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110518344.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离网式双充电电池供能系统及其应用
- 下一篇:一种角钢切割工艺
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理