[发明专利]一种基于多阶段MapReduce模型的纳税人偷漏税嫌疑群组检测方法有效
申请号: | 201510920257.3 | 申请日: | 2015-12-10 |
公开(公告)号: | CN105574649B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 田锋;乐佳;齐天亮;吴凡;郑庆华;马天;姚昀东;兰田 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00;G06Q50/26 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 mapreduce 模型 纳税人 偷漏税 嫌疑 检测 方法 | ||
本发明公开了一种基于多阶段MapReduce模型的纳税人偷漏税嫌疑群组检测方法,包括以下步骤:首先,提出了利用多网融合来构建基于着色图的纳税人利益关联网络的方法;其次,提出了基于强连通分量的纳税人利益关联网络的约减方法;然后,引入利益前件网络的概念,在利益前件网络中发现所有的极大弱连通子图,最后,利用多阶段MapReduce模型,对每个极大弱连通子图及其对应的交易边构建模式树,然后遍历模式树来生成模式库,进而对模式库中的模式进行两两匹配,找到所有符合匹配原则的模式对,最终生成所有的纳税人偷漏税嫌疑群组。其中,多阶段MapReduce模型由于采用分布式计算,能够极大地提高国家税务部门的嫌疑偷漏税分析效率,为国家挽回税务流失的损失。
技术领域
本发明涉及一种基于多阶段MapReduce模型的纳税人偷漏税嫌疑群组检测方法。
背景技术
随着信息技术的不断发展,国家税务信息化已初步建立了统一的电子申报、缴税、审批的一体化技术支撑与服务平台,并生成海量税务数据。但是对于企业偷税漏税的分析都是人工分析,且税务数据跨区域异质存储,难以发现纳税人之间隐式的利益关联。
专利“基于纳税人利益关联网络模型的偷漏税关联企业识别方法”(CN103383767B)利用着色加权图进行建模,并给出了基于边和节点颜色的五种聚合算子,结合这些聚合算子发现纳税人利益关联最小网络,同时对基于着色加权图的纳税人利益关联网络进行简化;然后,引入了节点环介数的概念,在简化后的网络中发现最大介数约束的有向闭环集的纳税人利益关联集团,最后,利用企业之间的交易行为权重,识别纳税人利益关联最小网络和纳税人利益关联集团中的偷漏税行为。
专利“一种基于纳税人利益关联网络的可疑纳税人识别方法”(CN104103011B)提出了一种基于纳税人利益关联网络的拓扑特征来识别可疑纳税人的方法。首先,对纳税人利益关联网络进行拓扑特征的分析,采用Motif寻找频繁子图,并根据度中心度和聚集系数拓扑指标寻找正常和可疑纳税人的差异;其次,选择拓扑特征,使用C4.5分类器实验,从而实现自动识别可疑纳税人的功能。
以上现有的纳税人偷漏税嫌疑群组检测方法存在如下问题:1.所构建纳税人利益关联网络没有考虑大规模节点和复杂的边关系导致的图处理时间和空间复杂度高的问题;2.图约减与图挖掘方面存在模式组合爆炸问题;3.专利CN104103011B难以发现非motif结构(如五边形、六边形等)的偷漏税企业群组。以上三点导致了它们必然在处理大规模图数据时效率低下。
发明内容
为克服现有技术中的问题,本发明的目的在于提供基于多阶段MapReduce模型的纳税人偷漏税嫌疑群组检测方法。
为了达到以上目的,本发明是采取如下技术方案予以实现的:
一种基于多阶段MapReduce模型的纳税人偷漏税嫌疑群组检测方法,包括以下步骤:
(一)基于着色图的纳税人利益关联网络的构建
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510920257.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应急任务调度的方法及系统
- 下一篇:全自动智能药房系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理