[发明专利]一种实体标签关联预测方法、装置及计算机可读存储介质在审
申请号: | 202111424257.6 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114091614A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 刘砺志;王钰;蒋海俭;闵青 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/28;G06F17/16;G06N3/04;G06N3/08 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 操寒 |
地址: | 201203 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 标签 关联 预测 方法 装置 计算机 可读 存储 介质 | ||
1.一种实体标签关联预测方法,其特征在于,包括:
确定实体关系网络、标签关系网络以及实体标签关联网络,所述实体标签关联网络包含未知的实体标签关联关系;
根据所述实体关系网络构造实体相似度图,根据所述标签关系网络和所述实体标签关联网络构造标签相似度图;以及根据所述实体标签关联网络构造实体标签关联二部图;
抽取实体特征,并根据标签相似度图构建标签特征;
将所述实体相似度图、所述标签相似度图和所述实体标签关联二部图融入图卷积网络以构建预测模型;
将所述实体特征、所述标签特征输入所述预测模型进行训练直至模型收敛,输出所述预测模型的预测结果,所述预测结果包括每个实体和每个标签之间的关联关系。
2.根据权利要求1所述的方法,其特征在于,确定实体关系网络、标签关系网络以及实体标签关联网络,还包括:
确定以实体集合中的多个实体为节点的实体关系网络其中,n为实体总数,所述用于指示所述实体集合中的各个实体之间的关系;
确定以标签集合中的多个标签为节点的标签关系网络其中,m为标签总数,所述用于指示所述标签集合中各个标签之间的关系;
根据现有标注信息确定实体标签关联网络其中,每个实体ui(i=1,2,...,n)和每个标签hj(j=1,2,...,m)间的关联取值为1或0。
3.根据权利要求1或2所述的方法,其特征在于,所述标签集合为层次化标签集合,所述标签关系网络形成为树结构,所述树结构的上下级标签节点之间具有父子继承关系。
4.根据权利要求3所述的方法,所述方法还包括:
根据所述标签之间的层次化关系更新所述现有标注信息;
其中,若指定实体标注有指定标签,则根据所述标签关系网络为所述指定实体补充标注所述指定标签的全部祖先标签。
5.根据权利要求2所述的方法,其特征在于,根据所述实体关系网络构造实体相似度图,还包括:
根据所述实体关系网络图Gu的邻接矩阵Au确定实体相似度图Su;
其中,所述邻接矩阵Au∈[0,1]n×n形成为n阶方阵,所述实体关系网络图Gu为无向有权网络,实体ui与实体ui′间的边权值用于指示两个实体间关系的紧密程度。
6.根据权利要求3所述的方法,其特征在于,根据所述标签关系网络和所述实体标签关联网络构造标签相似度图,还包括:
基于所述实体标签关联网络计算每个标签的标签信息量IC(h),所述标签信息量用于指示每个标签的实体标注比例度量每个标签的具体化程度:
利用每个标签的所述标签信息量以及所述标签关系网络计算标签间相似度,得到标签相似度图Sh;
其中,所述标签相似度图Sh∈[0,1]m×m形成为m阶方阵。
7.根据权利要求6所述的方法,其特征在于,利用以下公式计算所述标签间相似度:
其中,hMICA是标签hj与标签hj′的最富信息公共祖先,即标签hj与标签hj′具有最高标签信息量的公共祖先标签节点。
8.根据权利要求6或7所述的方法,其特征在于,利用以下公式计算每个标签的所述标签信息量:
其中,n是实体总数,nh是已知的被标签h所标注的实体个数。
9.根据权利要求2所述的方法,其特征在于,根据所述实体标签关联网络构造实体标签关联二部图,包括:
根据所述实体标签关联矩阵R构造实体标签关联二部图为A;
其中,所述所述0为全零矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111424257.6/1.html,转载请声明来源钻瓜专利网。