[发明专利]跨网络实体的识别方法、装置、电子设备及介质有效
申请号: | 202010299820.0 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111539210B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 常文睿;冯天恒 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N5/01 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘进 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 实体 识别 方法 装置 电子设备 介质 | ||
1.一种跨网络实体的识别方法,包括:
根据多个实体及实体间的关联关系,构建异构网络,其中,所述多个实体位于多个网络中;
从所述异构网络中选取一个实体作为目标实体,基于链路预测算法对目标实体进行召回识别,从所述异构网络中识别出召回实体,其中,所述目标实体和所述召回实体位于所述多个网络中的不同网络中;
基于已创建的实体识别模型对所述召回实体进行识别,识别出所述召回实体与所述目标实体是否为同一个实体;
所述从所述异构网络中选取一个实体作为目标实体,基于链路预测算法对目标实体进行召回识别,从所述异构网络中识别出召回实体,包括:
从所述异构网络中选取所述目标实体;
通过链路预测算法,对所述目标实体与每个备选实体之间的链路进行预测,其中,每个备选实体在所述异构网络中均与所述目标实体不相连;
基于所述目标实体与每个备选实体之间的相似度,从所有备选实体中确定所述召回实体,其中,所述召回实体与所述目标实体位于所述多个网络的不同网络中。
2.如权利要求1所述的方法,所述基于所述目标实体与每个备选实体之间的相似度,从所有备选实体中确定所述召回实体,包括:
通过链路预测算法,对所述目标实体与每个备选实体之间的链路进行预测,得到所述目标实体与每个备选实体之间的相似度;
选取大于设定相似度的相似度对应的备选实体作为所述召回实体。
3.如权利要求1-2任一项所述的方法,所述基于已创建的实体识别模型对所述召回实体进行识别,识别出所述召回实体与所述目标实体是否为同一个实体,包括:
若所述召回实体的数量为1,则使用所述实体识别模型对所述召回实体进行识别,识别出所述召回实体与所述目标实体是否为同一个实体;
若所述召回实体的数量≥2,则通过预先创建的实体筛选模型对所述召回实体进行筛选,筛选出可信度最高的一个召回实体;使用所述实体识别模型对筛选出的召回实体进行识别,识别出所述筛选出的召回实体与所述目标实体是否为同一个实体。
4.如权利要求3所述的方法,在从所述异构网络中识别出召回实体之后,所述方法还包括:
获取所述目标实体和所述召回实体之间的召回网络;
基于预设的边强度,对所述召回网络中的边进行筛选,得到筛选后的召回网络。
5.如权利要求4所述的方法,在得到筛选后的召回网络之后,所述方法还包括:
对所述筛选后的召回网络中目标实体与召回实体之间的每条链路进行分级,得到所述目标实体与所述召回实体之间的每条链路的级别;
根据所述目标实体与所述召回实体之间的每条链路的级别,获取所述目标实体与所述召回实体之间的目标链路,其中,所述目标链路的级别大于预设级别。
6.如权利要求5所述的方法,所述基于已创建的实体识别模型对所述召回实体进行识别,识别出所述召回实体与所述目标实体是否为同一个实体,包括:
若所述召回实体的数量为1,使用所述实体识别模型对所述目标实体和所述召回实体之间的目标链路进行识别,识别出所述召回实体与所述目标实体是否为同一个实体;
若所述召回实体的数量≥2,使用所述实体识别模型对所述目标实体和筛选出的召回实体之间的目标链路进行识别,识别出所述召回实体与所述目标实体是否为同一个实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010299820.0/1.html,转载请声明来源钻瓜专利网。