[发明专利]模型的训练方法、三元组的嵌入方法、装置、介质及设备有效
申请号: | 201910875584.X | 申请日: | 2019-09-17 |
公开(公告)号: | CN110598006B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 王尧;李林峰 | 申请(专利权)人: | 南京医渡云医学技术有限公司;南京懿医云大数据科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 三元 嵌入 装置 介质 设备 | ||
1.一种三元组的嵌入模型的训练方法,其特征在于,所述方法包括:
获取N组训练样本,其中,每组训练样本包括:三元组和所述三元组所表述的知识成立的概率,N为大于1的整数;
将第i组训练样本中的三元组输入嵌入模型,根据所述嵌入模型的输出得到投影距离Si,其中,i为小于等于N的正整数;
根据所述第i组训练样本的概率Pi和所述投影距离Si确定所述嵌入模型的损失函数,以基于所述损失函数训练所述嵌入模型;
所述获取N组训练样本,包括:
获取N1组训练正样本和N2组训练负样本;其中,每组训练正样本包括:第一三元组和所述三元组所表述的知识成立的第一概率,每组训练负样本包括:第二三元组和预设概率值;
所述将所述第i组训练样本中的三元组输入嵌入模型,根据所述嵌入模型的输出得到投影距离Si,包括:
将第i1组训练正样本中的第一三元组输入嵌入模型,根据所述嵌入模型的输出得到第一投影距离Si1,其中,i1为小于等于N1的正整数;以及,将第i2组训练负样本中的第二三元组输入所述嵌入模型,根据所述嵌入模型的输出得到第二投影距离Si2,其中,i2为小于等于N2的正整数;
所述根据所述第i组训练样本的概率Pi和所述投影距离Si确定所述嵌入模型的损失函数,包括:
根据所述第i1组训练正样本的第一概率Pi1和所述第一投影距离Si1确定第一损失函数;根据所述预设概率值和所述第二投影距离Si2确定第二损失函数;以及,根据所述第一损失函数和所述第二损失函数确定所述嵌入模型的损失函数。
2.根据权利要求1所述的三元组的嵌入模型的训练方法,其特征在于,所述根据所述第i组训练样本的概率Pi和所述投影距离Si确定所述嵌入模型的损失函数,包括:
基于预设的映射函数,将第i个组训练样本中的概率Pi映射为第i组训练样本对应的目标距离Di;
根据所述目标距离Di和所述投影距离Si的差值确定所述嵌入模型的损失函数;
其中,所述映射函数为投影距离Si的值域和概率Pi的值域之间实现一对一映射的单调函数。
3.根据权利要求1所述的三元组的嵌入模型的训练方法,其特征在于,所述根据所述第i1组训练正样本的第一概率Pi1和所述投影距离Si1确定第一损失函数,包括:
基于预设的映射函数,将第i1个组训练正样本中的第一概率Pi1映射为第i1组训练正样本对应的第一目标距离Di1;
根据所述第一目标距离Di1和所述第一投影距离Si1的差值确定所述第一损失函数;
其中,所述映射函数为第一投影距离Si1的值域和第一概率Pi1的值域之间实现一对一映射的单调函数。
4.根据权利要求3所述的三元组的嵌入模型的训练方法,其特征在于,所述根据所述预设概率值和所述第二投影距离Si2确定第二损失函数,包括:
基于所述预设的映射函数,将所述预设概率值映射为第二目标距离D’;
根据所述第二目标距离D’和所述第二投影距离Si2的差值确定所述第二损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医渡云医学技术有限公司;南京懿医云大数据科技有限公司,未经南京医渡云医学技术有限公司;南京懿医云大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910875584.X/1.html,转载请声明来源钻瓜专利网。