[发明专利]一种基于知识图谱的关联交易挖掘识别方法及装置有效
申请号: | 202010229331.8 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111444410B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 李振;宋璞;刘恒;赵兴莹;秦培歌;李勇辉 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/36 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 关联 交易 挖掘 识别 方法 装置 | ||
本发明公开了一种基于知识图谱的关联交易挖掘方法及装置,涉及信息系统技术领域,包括以下步骤:S1:获取目标数据,清洗筛选出可信数据;S2:对所述可信数据进行实体抽取和关系抽取,将抽取后得到的实体和实体间对应关系导入图数据库,生成初步知识图谱;S3:从所述初步知识图谱中查找满足关联规则的实体对,将实体对之间的关联关系增加入S2中的所述图数据库,获得完善知识图谱;S4:通过图表示学习算法进一步增加关联关系,得到最终知识图谱;S5:利用所述最终知识图谱识别关联交易信息。本发明通过知识图谱的手段,有效增强了关联交易的识别效率且一定程度上通过其多维度的穿透能力识别隐藏的关联交易。
技术领域
本发明涉及信息系统技术领域,尤其是涉及一种基于知识图谱的关联交易挖掘识别方法及装置。
背景技术
关联交易是企业关联方之间的交易,它是公司运作中经常出现而又易于发生不公平结果的交易。在理想状态下,只要是企业集团正常经营和发展的需要,而且交易不损害其他方利益,关联交易则是一种正当的交易行为。然而,部分企业在利用关联交易降低交易成本,提高公司运行效率的同时,企业控股股东通过关联交易操纵利润、粉饰业绩、侵害中小股东利益。因此,关联交易的非良性滋长无论在规模、性质还是其外部危害,都警示我们需要在金融和经济安全的高度重新认识关联交易问题的严重性,识别关联交易以及如何有效地识别关联交易便成为交易行为中不容忽视的一环。
然而,由于信息不对称、不共享和关联交易的复杂性、隐蔽性和强力的利益驱动,及时地识别关联交易并有效地予以管理和规范并不容易。现有手段下,识别关联交易主要依赖目标企业主动申报以及从工商信息等角度手工搜索,效率极低且很难有效识别被隐藏或粉饰的关联交易。通过知识图谱的手段,可有效增强关联交易的识别效率且一定程度上通过其多维度的穿透能力可识别隐藏的关联交易。
发明内容
有鉴于此,本发明旨在提供一种基于知识图谱的关联交易挖掘识别方法及装置,能够通过图谱中各关系识别双方是否存在可能的关联关系,并与客户交易相匹配,从而产生关联交易预警。
根据本发明的第一方面,提供了一种基于知识图谱的关联交易挖掘识别方法,所述方法用于挖掘并识别关联交易,包括以下步骤:
S1:获取目标数据,清洗筛选出可信数据;
S2:对所述可信数据进行实体抽取和实体间对应关系抽取,将抽取后得到的实体和实体间对应关系导入图数据库,生成初步知识图谱;
S3:从所述初步知识图谱中查找满足关联规则的节点对,将节点对之间的关联关系添入S2中的所述图数据库,获得完善知识图谱;
S4:在所述完善知识图谱的基础上,通过图表示学习算法进一步增加关联关系,得到最终知识图谱;
S5:利用所述最终知识图谱识别关联交易信息。
进一步的,所述S1具体包括:
S11:利用爬虫手段在网站上爬取所需信息,并结合内部信息,将得到的全部信息作为目标数据;
S12:剔除目标数据中错误、重复及无关的信息,得到清洗后数据;
S13:根据信息来源为清洗后数据中的每条信息设置权重系数,并计算得到每条信息的可信度;
S14:设置置信阈值为正数,从清洗后数据中剔除可信度低于所述置信阈值的信息,将剩余信息作为可信数据。
进一步的,所述信息来源包括多级别信息来源,信息来源的级别越高,为从中得到的信息设置的权重系数越大。
进一步的,所述计算得到每条信息的可信度,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010229331.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于动态模板获取规范化文档的方法及装置
- 下一篇:电子设备