[发明专利]基于企业知识图谱的模型训练方法、系统及相关装置在审
申请号: | 202110724205.4 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113449046A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 张乐情 | 申请(专利权)人: | 平安资产管理有限责任公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06Q40/06 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 邓小玲 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 企业 知识 图谱 模型 训练 方法 系统 相关 装置 | ||
本发明提供了一种基于企业知识图谱的模型训练方法,训练方法包括,获取与企业关联的多个实体,以及各个实体的原始信息;根据各个实体的原始信息,抽取N个连接关系值;在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型;本实施例提取关联性较强的实体作为构建知识图谱的节点,减少了构建知识图谱的数据量,提高了图谱的构建效率;提高了风险传导模型进行风险预测的准确率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于企业知识图谱的模型训练方法、系统、计算机设备及计算机可读存储介质。
背景技术
近年来的违约事件数量日益增长,风险的控制与预警在风险投资中起到重要的作用,风险的有效预警能避免投资人出现重大损失;初具规模的企业与其他企业和自然人之间会存在各种关联关系;导致企业的信用风险不仅仅是与自身的经营状况有关;还会受到与企业具有关联关系的主体的影响,即具有关联关系的主体的信用风险可能会传导给企业自身;因此,与企业具有关联关系的主体的信用风险通常被作为企业风险评估的重要因素之一。
针对关联主体之间的风险传导性,现有的主流方法是基于风控人员的专家经验和实地考察,然后进行主观判断,从而给出目标企业的风险等级,由于不同的专业人员评判会有差异,存在较强的主观性;所以此类预测结果难以量化;
现有技术中,也有基于图嵌入的风险传导模型,利用企业间的关联图谱,结合图嵌入方法,将企业映射到低维向量表示空间,在低维向量表示空间中企业之间的关系满足简单的矢量加减运算规律,然后根据计算空间中的企业之间的距离大小来模拟企业间的风险传导概率高低。
知识图谱又称为科学知识图谱,是显示知识发展进程与结构关系的一系列图形,用可视化的网络描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系;
而利用知识图谱作为风险传导模型训练的基础是现有模型训练常用的做法,现有的知识图谱一般是通过采集大量的实体数据,图谱构建时间长、数据挖掘不准确;导致基于知识图谱训练出的风险传导模型的风险预测的准确度低。
发明内容
本发明的目的是提供,用于解决以下问题:图谱构建时间长,训练出的风险传导模型的风险预测的准确度低的问题。
本发明实施例的一个方面提供了一种基于企业知识图谱的模型训练方法,所述方法包括,获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种;根据各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体;在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N;从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应;通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值;所述已知风险值与所述企业信用评级呈反比;基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
可选地,从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系的步骤,包括,分别从不同的数据结构中获取所述各个实体的原始信息;通过图映射或D2R转换或包装器归纳或信息抽取将所述原始信息转换为RDF三元组数据进行存储;所述原始信息包括结构化数据、半结构化数据以及文本数据;所述RDF三元组数据包括K个实体、K个实体属性值以及M个实体连接关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安资产管理有限责任公司,未经平安资产管理有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110724205.4/2.html,转载请声明来源钻瓜专利网。