[发明专利]一种多场景的异构数据处理方法有效
申请号: | 202310416643.3 | 申请日: | 2023-04-19 |
公开(公告)号: | CN116150405B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 曹扬;李响;仲恺;谢红韬;汪榕;支婷;祁纲;程建润;周伟;黄铁淳 | 申请(专利权)人: | 中电科大数据研究院有限公司;太极计算机股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06F18/25;G06F18/22;G06N3/0464;G06N3/045;G06N3/09;G06N3/084 |
代理公司: | 北京智桥联合知识产权代理事务所(普通合伙) 11560 | 代理人: | 金光恩 |
地址: | 550081 贵州省贵阳市观*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 场景 数据处理 方法 | ||
1.一种多场景的异构数据处理方法,其特征在于,包括:
基于第一图神经网络,从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中获取对应文本实体的结构拓扑特征;所述第一图神经网络是基于图卷积神经网络构建的;
基于第二图神经网络,从所述第一知识图谱和所述第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;所述第二图神经网络是基于transE模型构建的;所述三元组包括两个文本实体以及连接所述两个文本实体的实体关系;
融合所述第一知识图谱和所述第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;
基于所述第一知识图谱中任一文本实体的第一实体表示与所述第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;
基于所述第一实体对齐概率矩阵,确定所述第一知识图谱和所述第二知识图谱的对齐实体对,并基于所述对齐实体对融合所述第一知识图谱和所述第二知识图谱的数据;
所述从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中获取对应文本实体的结构拓扑特征,具体包括:
图结构信息提取步骤:针对任一文本实体,基于所述任一文本实体的任一邻居文本实体在上一网络层的图实体特征以及连接所述任一邻居文本实体与所述任一文本实体的实体关系在上一网络层的图关系特征,确定所述任一邻居文本实体在当前网络层传递给所述任一文本实体的关联特征,再融合各个邻居文本实体在当前网络层传递给所述任一文本实体的关联特征,得到所述任一文本实体在当前网络层的图实体特征,并更新得到连接所述任一邻居文本实体与所述任一文本实体的实体关系在当前网络层的图关系特征;任一文本实体在首层网络层的图实体特征以及任一实体关系在首层网络层的图关系特征是初始化得到的;
迭代步骤:重复所述图结构信息提取步骤,直至得到各个文本实体在最后一个网络层的图实体特征,并基于各个文本实体在各个网络层的图实体特征,确定所述各个文本实体的结构拓扑特征;
所述从所述第一知识图谱和所述第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征,具体包括:
基于第二图神经网络获取所述第一知识图谱和所述第二知识图谱的各三元组中头尾文本实体的第二实体表示以及实体关系的初始关系特征;
将连接同一文本实体的实体关系的初始关系特征融合,得到连接所述同一文本实体的实体关系的关系特征;
其中,任一文本实体的第二实体表示是所述第二图神经网络输出的表示所述任一文本实体的语义信息的向量,任一三元组中头文本实体的第二实体表示与实体关系的初始关系特征的向量和等于尾文本实体的第二实体表示,且各文本实体的第二实体表示满足相匹配的文本实体的第二实体表示之间距离小于预设值的约束。
2.根据权利要求1所述的多场景的异构数据处理方法,其特征在于,所述基于所述任一文本实体的任一邻居文本实体在上一网络层的图实体特征以及连接所述任一邻居文本实体与所述任一文本实体的实体关系在上一网络层的图关系特征,确定所述任一邻居文本实体在当前网络层传递给所述任一文本实体的关联特征,具体包括:
融合所述任一文本实体的任一邻居文本实体在上一网络层的图实体特征以及连接所述任一邻居文本实体与所述任一文本实体的实体关系在上一网络层的图关系特征,得到融合特征;
基于连接所述任一邻居文本实体与所述任一文本实体的实体关系的方向以及不同方向对应的权重,对所述融合特征进行加权,得到所述任一邻居文本实体在当前网络层传递给所述任一文本实体的关联特征。
3.根据权利要求1所述的多场景的异构数据处理方法,其特征在于,所述更新得到连接所述任一邻居文本实体与所述任一文本实体的实体关系在当前网络层的图关系特征,具体包括:
基于各类实体关系在当前网络层对应的关系变换矩阵,对连接所述任一邻居文本实体与所述任一文本实体的实体关系在上一网络层的图关系特征进行特征变换,得到连接所述任一邻居文本实体与所述任一文本实体的实体关系在当前网络层的图关系特征;其中,所述各类实体关系在当前网络层对应的关系变换矩阵是训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科大数据研究院有限公司;太极计算机股份有限公司,未经中电科大数据研究院有限公司;太极计算机股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310416643.3/1.html,转载请声明来源钻瓜专利网。