[发明专利]机器学习处理中的跨域结构化映射在审
申请号: | 202111381967.5 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114764638A | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | Y·J·昂格;E·K·巴特勒;R·安格尔;G·H·弗洛雷斯;A·梅加赫德;N·拉姆钱达尼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 吴信刚 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 处理 中的 结构 映射 | ||
1.一种使用执行来使不相似数据的两个或更多个语料库相关的计算设备的方法,所述方法包括:
从不相似数据的两个或更多个语料库中的每个接收输入数据;
由所述计算设备计算所述输入数据中的每个到两个或更多个编码器-解码器模型中的传递;
由所述计算设备从所述两个或更多个编码器-解码器模型中的每个获得用于每个不同知识域的身份映射的预测;
由所述计算设备计算分布距离度量作为来自所述两个或更多个编码器-解码器模型中的每个的低维嵌入向量表示中的每个的输出;
由所述计算设备基于来自所述两个或更多个编码器-解码器模型中的每个编码器-解码器模型的所述预测和所述分布距离度量中的每个来计算一函数;并且
由所述计算设备更新所述两个或更多个编码器-解码器模型。
2.根据权利要求1所述的方法,还包括:
由所述计算设备使用相应预测和来自不相似数据的所述两个或更多个语料库中的每个的所述输入数据来计算所述两个或更多个编码器-解码器模型中的每个的对应重构损失;并且
由所述计算设备从所述两个或更多个编码器-解码器模型中的每个提取输入数据表示的低维嵌入向量。
3.根据权利要求2所述的方法,其中所述分布距离度量是成对平均相对存活时间(MRLT)分布距离度量,并且所述函数是联合损失函数。
4.根据权利要求3所述的方法,还包括:
由所述计算设备计算相对于所述两个或更多个编码器-解码器模型中的每个的模型参数的来自所述联合损失函数的损失的梯度。
5.根据权利要求4所述的方法,还包括:
由所述计算设备初始化所述两个或更多个编码器-解码器模型中的每个编码器-解码器模型的权重;
由所述计算设备执行将所述输入数据预处理、变换和提取为固定维度特征向量;
由所述计算设备执行前馈处理以用于将所述输入数据的每个域内样本前馈传递到所述两个或更多个编码器-解码器模型中的每个相应模型中;
由所述计算设备使用所述两个或更多个编码器-解码器模型中的每个来为所述输入数据的所述域内样本中的每个生成对应的输出预测;并且
在给定所述输入数据的所述域内样本和所述对应的输出预测的情况下,由所述计算设备针对所述两个或更多个编码器-解码器模型中的每个,计算关于所述联合损失函数的对应损失值。
6.根据权利要求4所述的方法,还包括:
由所述计算设备基于所述输入数据的各个所述域内样本之间的第一相对存活时间(RLT)矩阵和第二RLT矩阵并且基于使用在所述第一RLT矩阵和所述第二RLT矩阵之间定义的这两个相对存活时间度量,来计算所述成对MRLT分布距离度量。
7.根据权利要求4所述的方法,还包括:
由所述计算设备基于所述输入数据的各个所述域内样本之间的第一相对存活时间(RLT)矩阵和第二RLT矩阵并且基于使用所述第一RLT矩阵的输出和所述第二RLT矩阵的输出之间的平方损失函数,来计算所述成对MRLT分布距离度量。
8.根据权利要求4所述的方法,还包括:
由所述计算设备基于所述输入数据的各个所述域内样本之间的第一相对生存时间(RLT)矩阵和第二RLT矩阵并且基于使用所述第一RLT矩阵和所述第二RLT矩阵的分布的瓦瑟斯坦距离确定,来计算所述成对MRLT分布距离度量。
9.根据权利要求1所述的方法,其中不相似数据的所述两个或更多个语料库包括不同知识域中的文本、图像、音频和其他数据源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111381967.5/1.html,转载请声明来源钻瓜专利网。