[发明专利]一种基于碳中和潜在语义的中文动态知识图谱补全的方法在审
申请号: | 202310541413.X | 申请日: | 2023-05-15 |
公开(公告)号: | CN116521902A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 朱西平;肖丽娟;杨欢;高昂;郭露;陈怡男;陈惠芬;梁琳 | 申请(专利权)人: | 西南石油大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/289;G06F40/151;G06F18/22;G06F40/30;G06F18/214;G06N3/088;G06N3/045 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 中和 潜在 语义 中文 动态 知识 图谱 方法 | ||
1.一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,包括以下步骤:
S1:将碳中和相关四元组分为时间关系的头实体和单独尾实体;
S2:将上述所得时间关系的头实体替换为相关的文本描述,将其文本描述组合为[CLS],[htext],[SEP],[T],[rtext],[SEP]送入MacBERT编码器中得到相关嵌入向量ehTr;
S3:将上述所得单独尾实体替换为相关的文本描述,将其文本描述组合为[CLS],[ttext],[SEP]送入另外一个MacBERT编码器中得到相关嵌入向量et;
S4:利用余玄相似度计算时间关系的头实体向量ehTr和尾实体向量et进行点积计算,用于三元组补全;
S5:期间使用对比实验,通过添加负样本来与正样本进行对比学习和图重排序提高整体模型效率;
S6:知识图谱的拓扑结构和软逻辑规则中也存在部分潜在语义。将知识图谱的拓扑结构和软逻辑规则嵌入到语言预训练模型中;
S7:计算原神经网络损失时使用平均池化,软标签模块使用最大池化时,那么在整体模型测试阶段,利用平均池化获得头实体和关系的文本描述句子嵌入与平均池化获得候选尾实体的文本描述句子嵌入用于得到一组预测分数,再利用最大池化获得的候选尾实体的文本描述句子嵌入得到另一组预测分数,最后将两组分数进行比较分析得到最终的预测结果。
2.如权利要求1中所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S2和S3中得到时间关系的头实体向量ehTr和尾实体向量et。
3.如权利要求1中所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S4相似度计算公式:
式中,式中,S为两个实体的相似度;ehTr为时间关系的头实体向量;et为尾实体向量。
4.如权利要求1中所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S5中负样本要足够充分。
5.如权利要求1中所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S5中基于图的重新排序策略,预测得分增加α≥0,预测分数计算公式更新为:
式中,argmax为预测分数最大值;ti为第i个候选尾实体,ehTr为时间关系的头实体向量;为尾实体向量;α为重排序阈值。。
6.如权利要求1中所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S6中相似软逻辑规则约束问题,满足相似的约束条件时,预测得分增加β≥0,预测分数计算公式更新:
式中,argmax为预测分数最大值;ti为第i个候选尾实体,ehTr为时间关系的头实体向量;为尾实体向量;α为重排序阈值;β为相似软逻辑阈值。
7.如权利要求1中所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S7中将两组分数进行比较分析得到最终的预测结果,预测分数计算公式更新为::
式中,argmax为预测分数最大值;ti为第i个候选尾实体,ehTr为时间关系的头实体向量;为尾实体向量;α为重排序阈值;β为相似软逻辑阈值;为最大池化和平均池化结果结合计算。
8.如权利要求1所述的一种基于碳中和潜在语义的中文动态知识图谱补全的方法,其特征在于,所述步骤S7中使用两种句子嵌入方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学,未经西南石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310541413.X/1.html,转载请声明来源钻瓜专利网。