[发明专利]一种白酒消费税风险评估方法在审
申请号: | 202011046196.X | 申请日: | 2020-09-29 |
公开(公告)号: | CN112184022A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 迟敬泽;吴敬;金语泽;朱淞鹤 | 申请(专利权)人: | 神州数码信息系统有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00;G06Q30/02 |
代理公司: | 北京巨弘知识产权代理事务所(普通合伙) 11673 | 代理人: | 陈芹利 |
地址: | 100194 北京市海淀区西北旺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 白酒 消费税 风险 评估 方法 | ||
本发明提供了一种白酒消费税风险评估方法,包括以下步骤:利用白酒发票数据,基于白酒三要素构建白酒词典,并通过白酒字典实现白酒二分类和白酒品类匹配功能;对发票中包含的白酒三要素进行聚类,提取出白酒品类构建白酒品类库;利用税务数据构建关系网络;基于关系网络进行统计分析,依据计算规则计算出每种品类白酒的出厂价格和销售价格;将计算得到的每种品类白酒的出厂价格和销售价格与该品类白酒的消费税申报数据进行比对,评估白酒消费税风险,并生成风险评估结果报告。本方法不依赖于人工经验,而是通过对税务相关数据进行分析与挖掘,自动计算出白酒价格,并与白酒申报数据进行对比,从而高效准确地对白酒消费税风险进行评估。
技术领域
本发明涉及数据分析与挖掘技术领域,具体涉及一种白酒消费税风险评估方法。
背景技术
税务局每年会接收到海量的数据,部分数据是企业发生真实应税行为产生的,而还有一部分数据是企业为了自身利益偷逃国家税收,提供与实际经营业务情况不相符的数据。针对白酒行业,税务局征收的税主要是消费税。税务总局规定,对白酒生产企业设立多级销售单位销售的白酒,国税机关应按照最终一级销售单位对外销售价格核定生产企业消费税最低计税价格。具体要求如下:1.白酒生产企业销售给销售单位的白酒,生产企业消费税计税价格高于销售单位对外销售价格70%(含70%)以上的,税务机关暂不核定消费税最低计税价格。2.白酒生产企业销售给销售单位的白酒,生产企业消费税计税价格低于销售单位对外销售价格70%以下的,消费税按照最低计税价格征收。
税务局目前主要通过人工筛查的手段对白酒消费税风险进行评估,以发现少缴纳白酒消费税的纳税人。但人工筛查的方式依赖于税局工作人员的经验,并且面对海量繁杂白酒生产企业和相关税务数据,人工筛查效率很低,导致无法对白酒消费税风险进行全面和准确的评估。
因此,针对税局在白酒消费税审查中存在的上述问题,本发明提出了一种白酒消费税风险评估方法,通过数据分析与挖掘技术,构建白酒词典和多种关系网络进行统计分析和计算,自动发现存在白酒消费税风险的纳税人,从而协助税务机关堵漏增收,减少税务人员人工工作量。
发明内容
本发明为了解决现有技术中人工筛查的方式依赖于税局工作人员的经验,并且面对海量繁杂白酒生产企业和相关税务数据,人工筛查效率很低,导致无法对白酒消费税风险进行全面和准确的评估的问题,提供了一种白酒消费税风险评估方法,通过数据分析与挖掘技术,构建白酒词典和多种关系网络进行统计分析和计算,自动发现存在白酒消费税风险的纳税人,解决了上述问题。
本发明提供了一种白酒消费税风险评估方法,包括以下步骤:
S1、通过白酒发票数据分解白酒货品名称中的白酒要素,通过白酒要素构建白酒词典;
S2、通过白酒词典对白酒要素进行TF/IDF特征提取,并通过Kmeans聚类算法对所有白酒的白酒要素进行聚类,提取出所有白酒品类构建白酒品类库;
S3、利用税务数据构建白酒涉税关系网络;
S4、对白酒涉税关系网络进行统计分析,计算出每种品类白酒的出厂价格和销售价格;
S5、将计算得到的每种品类白酒的出厂价格和销售价格与该品类白酒的消费税申报数据进行比对,若计算销售价格×0.7>计算出厂价格,且无该品类白酒申报数据则为漏报,若申报出厂价格>申报最低计税价格或计算销售价格×0.7>计算出厂价格,且计算销售价格×0.6>申报最低计税价格则为错报;否则为正确申报。
首先对白酒发票的货物名称进行数据清理,将清理后的数据进行分词,在分词词典中新增三类词性,分别表示白酒的品名、规格和度数,并将相应的词语加入词典,构建白酒词典。基于构建好的白酒词典,可对任意白酒发票的货物名称提取白酒三要素提取。通过货物名称中是否包含白酒品名实现白酒二分类,判断任意货物名称是否属于白酒。通过对不同白酒三要素的对比实现白酒品类匹配,判断两个白酒货物名称是否属于同一种品类的白酒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神州数码信息系统有限公司,未经神州数码信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011046196.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种户外使用的带有防止生锈的抗震支架
- 下一篇:一种云渲染展示方法及装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理