[发明专利]一种缺失值的确定方法、装置及电子设备在审
申请号: | 201811628390.1 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109634939A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 郭佳敏;吴慧;袁帅;郭帅 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06Q40/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标实体 装置及电子设备 缺失数据 数据可靠性 实体参考 数据缺失 业务数据 向量 客户 | ||
本发明提供了一种缺失值的确定方法、装置及电子设备,首先确定出与目标实体相似的其他实体,然后采用与存在数据缺失的目标实体相似的其他客户的实体参考向量的业务数据,来确定目标实体的缺失数据,减少由于人工确定缺失数据带来的降低数据可靠性的问题。
技术领域
本发明涉及数据处理领域,更具体的说,涉及一种缺失值的确定方法、装置及电子设备。
背景技术
目前,银行在建立全行客户级的信用凭借模型时,需要对客户的交易数据、资产数据、客户信息等数据进行处理,但是在处理过程中,发现客户的数据存在缺失的问题。
现有技术中,当出现客户的数据缺失问题时,采用人工确定缺失数据的方式,但这样会增加人为干涉,降低数据可靠性。
发明内容
有鉴于此,本发明提供一种缺失值的确定方法、装置及电子设备,以解决采用人工确定缺失数据的方式,增加人为干涉,降低数据可靠性的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种缺失值的确定方法,包括:
确定存在数据缺失的目标实体的实体向量;所述实体向量为所述目标实体的向量表示;
确定与所述实体向量相似的实体参考向量集合;所述实体参考向量集合中的实体参考向量与所述实体向量的相似度大于第一预设数值;
基于所述实体参考集合中的实体参考向量的业务数据,确定所述目标实体的缺失数据。
优选地,确定存在数据缺失的目标实体的实体向量,包括:
获取知识图谱;所述知识图谱包括所述目标实体的三元组和多个实体样本的三元组;每一所述三元组包括头实体、尾实体、所述头实体和所述尾实体的事实性关系;
随机设定每一所述三元组的向量组;所述向量组包括所述三元组中的头实体的初始实体向量、尾实体的初始实体向量以及事实性关系对应的向量矩阵;
多次修改每一所述三元组的向量组中的至少一个数据,得到相应的三元组的多个负例向量组;
基于每一所述三元组的向量组和负例向量组,确定存在数据缺失的目标实体的实体向量。
优选地,基于每一所述三元组的向量组和负例向量组,确定存在数据缺失的目标实体的实体向量,包括:
通过初始评分模型确定每一所述三元组的评分值;所述初始评分模型用于计算为每一所述三元组随机设定的向量组的准确度;
基于每一所述三元组的评分值,计算所述初始评分模型的损失值;
判断所述损失值是否小于第二预设数值;
若不小于,调整每一所述三元组的向量组和负例向量组,并返回所述判断所述损失值是否小于第二预设数值这一步骤;
若小于,将所述目标实体的三元组的向量组中对头实体的初始实体向量进行调整后的向量作为所述目标实体的实体向量。
优选地,确定与所述实体向量相似的实体参考向量集合,包括:
依据预设余弦相似度计算公式,计算所述实体向量与每一实体样本的实体向量的相似度;
筛选出相似度大于所述第一预设数值的实体向量,并组成所述实体参考向量集合。
优选地,基于所述实体参考集合中的实体参考向量的业务数据,确定所述目标实体的缺失数据,包括:
获取所述实体参考向量的业务数据中与所述缺失数据相应的参考数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811628390.1/2.html,转载请声明来源钻瓜专利网。