[发明专利]基于知识图谱的隐藏关系获取方法、装置、设备和介质在审
申请号: | 202110037710.1 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112732937A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 马宁亚;陈奕安 | 申请(专利权)人: | 平安资产管理有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/215;G06F16/28;G06F40/216;G06F40/284;G06F40/289;G06Q40/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 200135 上海市浦东新区自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 隐藏 关系 获取 方法 装置 设备 介质 | ||
本申请涉及人工智能领域,尤其是一种基于知识图谱的隐藏关系获取方法、装置、设备和介质。所述方法包括:获取待处理企业数据,并提取待处理企业数据中的基础属性信息;比对基础属性信息以从待处理企业数据中获取存在隐藏关系的数据;根据知识图谱对基于基础属性信息无法获取到隐藏关系的待处理企业数据进行处理,以确定存在间接关系的待处理企业数据;获取存在间接关系的待处理企业数据的企业分类以及间接关系类型;根据企业分类和所述间接关系类型对存在间接关系的所述待处理企业数据进行清洗,以确定存在隐藏关系的数据。此外,本发明还涉及区块链技术,用户的隐私信息可存储于区块链节点中。采用本方法能够准确地提取企业间的隐藏关系。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于知识图谱的隐藏关系获取方法、装置、设备和介质。
背景技术
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。其中实际生活中,需要从大数据中进行挖掘以确定数据之间的隐藏信息,例如在企业信用风险判断的过程中,需要根据企业之间的关系,来确定企业的信用。但是通常企业之间一般具有直接关系或者是隐藏关系。传统技术中对于直接关系则可以通过所披露的财务报表等进行获取,而对于隐藏关系的获取则未有相关内容。
因此急需一种可以获取到企业之间的隐藏关系的方法。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确地提取企业之间的隐藏关系的基于知识图谱的隐藏关系获取方法、装置、设备和介质。
一种基于知识图谱的隐藏关系获取方法,所述方法包括:
获取待处理企业数据,并提取所述待处理企业数据中的基础属性信息;
比对所述基础属性信息以从所述待处理企业数据中获取存在隐藏关系的数据;
根据知识图谱对基于所述基础属性信息无法获取到隐藏关系的待处理企业数据进行处理,以确定存在间接关系的所述待处理企业数据;
获取存在间接关系的所述待处理企业数据的企业分类以及间接关系类型;
根据所述企业分类和所述间接关系类型对存在间接关系的所述待处理企业数据进行清洗,以确定存在隐藏关系的数据。
在其中一个实施例中,所述获取存在间接关系的所述待处理企业数据的企业分类,包括:
读取存在间接关系的所述待处理企业数据的分类字段;
当所述分类字段存在企业分类,则获取所述分类字段中的企业分类;
当所述分类字段不存在企业分类,则从存在间接关系的所述待处理企业数据提取各个位置的经营数据;
根据各个位置的所述经营数据得到所述待处理企业数据的企业分类。
在其中一个实施例中,所述根据各个位置的所述经营数据得到所述待处理企业数据的企业分类,包括:
对各个位置的所述经营数据进行分词处理,并获取每一个分词在所述经营数据中的分词位置;
根据所述分词以及对应的分词位置计算所述分词的逆向文档频率值;
获取逆向文档频率值大于预设值的分词;
通过所获取的分词得到存在间接关系的所述待处理企业数据的企业分类。
在其中一个实施例中,所述间接关系类型的获取方式包括:
获取通过一个关联节点连接的多个待处理企业数据对应的企业节点;
根据所获取的企业节点和关联节点的知识图谱结构得到间接关系类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安资产管理有限责任公司,未经平安资产管理有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110037710.1/2.html,转载请声明来源钻瓜专利网。