[发明专利]一种基于关联规则的海关归类检错方法有效
申请号: | 201910068875.8 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109858538B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 杨浩恩;束维国;郭磊;黄伟;陆军;乔启明 | 申请(专利权)人: | 科大国创软件股份有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06Q50/26;G06Q40/10 |
代理公司: | 合肥洪雷知识产权代理事务所(普通合伙) 34164 | 代理人: | 孙小华 |
地址: | 230000 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于关联规则的海关归类检错方法,涉及海关税务领域。本发明包括采用关联规则提速的词频统计算法,序列数据挖掘算法,针对海关数据所做的数据清洗规则以及根据海关实际问题的优化和阈值设计。本发明通过先验知识和数据处理方法提高了传统算法的准确性,并使用大数据技术将海关的海量数据用于模型的优化,使用过程中类似添加标准答案的方式,进一步提高数据的准确性。 | ||
搜索关键词: | 一种 基于 关联 规则 海关 归类 检错 方法 | ||
【主权项】:
1.一种基于关联规则的海关归类检错方法,其特征在于,包括如下步骤:步骤S1:利用归类的税则读取需要的所有归类要素;步骤S2:根据读取的归类要素,将每条数据归类到各个不同要素中;其中,要素包括数据要素、二值要素和文本要素;若数据归类到数据要素,则执行步骤S03;若数据归类到二值要素,则执行步骤S04;若数据归类到文本要素,则执行步骤S05;步骤S3:将数据进行单位统一后与读取的要素规格进行匹配,若匹配不成功则直接报错;步骤S4:判断数据取真还是取反,再与归类准则比对,若匹配不成功则直接报错;步骤S5:根据文本数据的不同类别执行步骤S6;步骤S6:根据每个序列,计算单个字对于序列个数的支持度,分布概率大于阈值的保存为频繁项集;步骤S7:对于其中的子列需要满足如下条件:1)组成其的低一级子列都是频繁项集;2)子列的支持度大于阈值;3)子列对于它的左子列的置信度大于阈值,则保持为频繁序列;步骤S8:循环步骤S7直至没有子列能满足条件1,则跳出执行步骤S9;步骤S9:将得到结果和归类要素中的标准答案给满分全部保存,留作之后实际评错时使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大国创软件股份有限公司,未经科大国创软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910068875.8/,转载请声明来源钻瓜专利网。