[发明专利]一种面向复杂税务数据系统的介区域识别方法在审
申请号: | 202211311742.7 | 申请日: | 2022-10-25 |
公开(公告)号: | CN115496570A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 郑庆华;武乐飞;师斌;王凯;董博;赵锐;赵子涵 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06V30/19;G06V30/412;G06N3/04 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 闵岳峰 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 复杂 税务 数据 系统 区域 识别 方法 | ||
本发明公开了一种面向复杂动态网络的层次划分和介区域识别方法,包括:首先,通过“静态快照构建‑动态时序嵌入”两阶段的方法,将复杂数据系统转化为语义等价的,包含对象、关系、属性和时序等要素的复杂动态网络;其次,基于系统科学中绝热消去原理,识别所关注的子系统随动态网络演化的主导因素,在此基础上构建边界尺度的假设空间;再次,基于频繁子图挖掘算法,挖掘各边界尺度的子图实例中的Motif;最后,基于二进制向量编码构建各边界尺度的相关度矩阵,再基于条件概率对边界尺度层级耦合关系建模,辨识子图模式层级耦合,通过置信度阈值判定两假设空间之间是否存在介区域。
技术领域
本发明属于人工智能与税控技术领域,特别涉及一种面向复杂税务数据系统的介区域识别方法。
背景技术
近年来,深度学习技术成功运用于税控领域,如偷漏税检测、行业分类、企业行为异常检测等,然而这类端到端的黑箱智能学习模型不可解释,引发人们对算法可信性、公平性产生质疑,甚至造成法律等问题,影响了深度学习在税控领域的大规模应用。深度学习模型具有层次结构,可以自动化学习高维抽象特征,但是获取的层级特征没有清晰的功能定义,无法和待求解问题产生知识关联,表现为模型预测的不可解释性,即只知其然而不知其所以然。上述现象是现有深度学习模型固有的缺点,深度学习模型本身已经难以解决,其根源在于深度学习的不可分解性,只有借助于外部知识才有望解决。介科学是一种复杂系统分析方法,能够从具有时空多尺度动态结构的数据系统中发现介区域,从而对复杂系统进行合理分解,该思想对可解释性学习模型的构建具有指导性。例如税控场景中的发票虚开检测可能存在诸如“发票-企业”、“企业-团伙”等层次中的介区域,因此,对复杂税务数据系统进行合理的层次划分和介区域识别,是增强深度学习技术在税控领域的可解释性的基础。更进一步地,复杂数据系统的层次划分和介区域识别,需首先识别系统的主导因素,即在系统演化中起主要作用的因素,例如发票虚开场景下的复杂数据系统演化的主导因素可能为“发票流向”。由于复杂数据系统的差异性、动态性和跨时空分布特性,其主导因素的识别是一个难题。
针对这一难题,以下文献提供了可参考的对复杂数据系统的层次划分和介区域识别问题的解决方案:
文献1:一种基于介科学指导提高深度学习数据集质量及模型可解释性的方法(201910566328.2);
文献2:一种基于邻域拓扑结构的异常金融组织层次划分系统及其工作方法(202011009471.0);
文献1提出了一种应用介科学指导提高深度学习数据集质量及模型可解释性的方法,它基于所处理对象的物理内容,提炼主导机制,建立介尺度模型,将介尺度模型与深度学习过程相关联,提升深度学习模型的可解释性。
文献2基于邻域拓扑结构对异常金融组织进行层次划分,对可疑金融组织的交易流水进行网络表示学习,将金融组织账号表征为对应的低维稠密向量,最后通过K-means对向量进行聚类,完成异常金融组织的层次划分任务,减少了在此类任务中的人工干预,此类方法采用的网络表征学习表示金融组织流水,并用无监督算法进行分类划分,面向的数据仅包括金融组织及其交易流水,数据系统简单可分,数据系统主导因素已知,另外表征学习和无监督聚类算法的可解释性较弱,很难适用于对可解释性要求较高的、主导因素未知的税控领域。
上述传统方法虽然可以解决特定的介尺度模型问题及层次划分问题,但是很难直接拓展至发票虚开场景下复杂动态系统的介区域识别上,原因在于上述方法的研究对象具有规模较小、动态演化特征不明显、或主导因素已知的特点,和本项目所要求的复杂数据系统差异很大,难以匹配发票虚开场景下的复杂数据系统具有的时空演化性强和层次耦合度高等特点。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211311742.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种线材固定机构
- 下一篇:一种基于介科学的可解释性发票虚开检测方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置