[发明专利]一种基于知识图谱的上市企业违法风险预测方法在审
申请号: | 202310226816.5 | 申请日: | 2023-03-10 |
公开(公告)号: | CN116384551A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 李朋骏;辛辉;谢镇玺;王金龙;熊晓芸 | 申请(专利权)人: | 青岛理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/0635;G06Q10/0639;G06Q50/18;G06N5/02;G06N3/042 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 刘娜 |
地址: | 266520 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 上市 企业 违法 风险 预测 方法 | ||
本发明公开了一种基于知识图谱的上市企业违法风险预测方法,通过构建企业关联方超图与Hyper‑GNN超图表示学习模型,将企业关联方集群的风险同化因素纳入企业违法预测中;改良图传递算法传播机理,采用社区划分算法划定违法风险扩散范围,并将企业利益关联紧密度与概率学机理引入图游走算法,模拟不良风险源在企业间模拟传播的图游走路径,通过图传递算法深层次迭代后的收敛趋向,精准评估可疑企业违法风险程度;设计Legal‑GNN神经网络,将企业风险特征与企业关联方集群特征相融合,增强稀疏化的可疑企业节点特征与大规模的合法企业节点特征的差异性,减弱节点嵌入表示时的特征相似程度,提高预测模型对违法企业的甄别精度。
技术领域
本发明涉及知识图谱技术领域和企业法律风控领域,特别涉及一种基于知识图谱的上市企业违法风险预测方法。
背景技术
据统计,近年来上市企业的违约违法案件的数量逐年上升,扰乱破坏了金融市场的良好秩序。由于上市企业股权投资、担保额度远超过中小企业,牵连的股东数量众多,监管者如不及时识别与管控违法风险,将损害其合作伙伴、相关投资方的财产利益。随着人工智能技术的兴起,已有学者致力于利用机器学习及深度学习领域模型赋能企业法律风控领域,通过对企业经营指标等大规模数据智能分析,推断企业违法倾向,陆续取得研究成果,实现了企业法律风险的自动化评估和企业违法预测。
然而,实际情况中上市企业间存在投资、担保、持股等多样化的利益关联,风险传递的方式错综复杂,并非仅与企业自身经营状况有关。并且信息化时代背景下的企业违法行为趋于隐蔽化,企业瞒报误报自身经营信息等不良行为屡有发生,账目数据的真实性无法得到保障,使得基于数据分析的企业违法预测模式在面对账目及征信记录无异样的违法企业时难以为继,监管方对上市企业进行违法预测和风险管控业务陷入困境。
知识图谱作为大规模语义关联网络,具备卓越的知识关联能力,成为金融风控领域的新兴技术。针对上述问题,Huidong Wu等人提出了基于路径搜索方法SFE的知识图谱推理框架,基于图结构推理出存在审计舞弊风险的企业;Xuting Mao等人通过知识图谱获取指定企业间的交易次数、贷款类交易占比等企业资金往来特征,结合机器学习模型识别出具有欺诈嫌疑的企业;Chunyan Xue以多类关系综合评估得到的风险传播概率量化节点间的关联程度,实现企业贷款违约关联风险的模拟传播,继而对信贷风险较高的企业实施风险预警。
现有方法虽然凭借知识图谱的信息关联特性实现了企业间违法风险的模拟传导和违法倾向的预测,但仍存在不足之处。一方面,基于图路径的风险模拟传递方法仅关注于企业两两之间“点对点”模式的风险传递,忽视了企业不良利益集群的隐患,且主观默认采用交易次数、贷款额或自拟权重数值量化风险传递程度,致使结果易受主观性影响;另一方面,依靠图表示学习的违法预测方法受限于合法企业与违法企业的比例不均衡的现象,庞大的合法企业集群包裹稀疏化的违法企业节点,在对目标企业节点进行邻域节点采样时违法企业节点特征与占比更多的合法企业节点特征相混淆,非法企业的违法特征信息未能有效被图神经网络表征,当违法企业拥有较多合法关联方时模型预测精度随之降低。
发明内容
为解决上述技术问题,本发明提供了一种基于知识图谱的上市企业违法风险预测方法,利用知识图谱技术弥补企业违法预测传统方法过度依赖经济学指标的缺陷,结合超图表示学习洞察企业违法行为的集群化效应,并改良图传播算法和图神经网络结构解决风险传递方式主观、片面以及具有较多合法关联方贸易伙伴的违法企业难以预测其违法倾向的问题。
为达到上述目的,本发明的技术方案如下:
一种基于知识图谱的上市企业违法风险预测方法,包括如下步骤:
步骤一,采集上市企业经营指标、违法事件以及关联方历史记录并通过爬虫获取企业违规事件日增量信息,对采集的信息进行数据清洗,并将所获得的数据均转化为结构化数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛理工大学,未经青岛理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310226816.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理