[发明专利]基于时序对齐预测的序列距离度量方法、存储介质及芯片有效
申请号: | 202110773058.X | 申请日: | 2021-07-08 |
公开(公告)号: | CN113487027B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 苏冰;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06N3/084 | 分类号: | G06N3/084 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 张玉梅 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时序 对齐 预测 序列 距离 度量 方法 存储 介质 芯片 | ||
本发明涉及机器学习技术领域,为基于时序对齐预测的序列距离度量方法、存储介质及芯片,包括步骤:先构建保序对齐预测(OAP)模型,对OAP模型进行自监督训练。保序对齐预测距离采用轻量级类似transformer的神经网络直接预测两个序列之间的最优对齐,因此在推理时只需要直接计算,不涉及优化。可以应用在序列分类和检索任务中,在获得和别的序列距离相当的性能同时,具有更快的推理速度。该方案提出的保序对齐预测OAP距离是可学习的序列距离,在推理中只需要直接计算,具有良好的可解释性;其次,通过设计产生近似真实对齐的序列增强方法,在此基础上,提出了自监督的OAP学习方法,不需要标注训练序列;此外,OAP距离可以方便地实现端到端的监督表征学习。
技术领域
本发明涉及机器学习技术领域,具体涉及基于时序对齐预测的序列距离度量方法、存储介质及芯片。
背景技术
序列之间的距离在序列分类、检索、聚类等应用中起着至关重要的作用。相比于向量距离,度量序列之间的距离更加困难,因为不同的序列可能有不同的采样率、执行速度、局部扭曲、初始状态和弹性扭曲。为了解决这些时序差异,现有的序列距离或者将每个序列编码成一个时序不变的特征向量,或者使用对齐进行时序对应校准。典型的基于特征的方法使用循环神经网络(RNN)对序列进行编码并度量相应特征之间的欧几里德距离。与计算与任何其他序列的距离时,一个序列的特征总是固定的。虽然这些方法是可学习的,并且在推理时只需要进行前向计算,但它们需要大量序列来训练复杂的RNN,并且可解释性较弱,因为不清楚学习到的特征如何处理时序差异以及可以处理哪些类型的时序差异。
基于对齐的方法为不同的序列对确定不同的最优对齐。这更加直观和灵活,因为在比较不同序列时,时序差异可能不同。大多数对齐方法在预定义的可行约束下解决优化问题以推断最优对齐。例如,DTW可能是应用最广泛的序列距离,其各种变体或进行加速推理,或适应增加或修改的约束,或处理来自不同模态的序列,其中Soft-DTW通过使用所有可行对齐的软最小成本作为目标来优化可微损失。但这些优化通常很耗时,不能充分利用GPU,并且不能很好地扩展到长序列。
此外,由于推断对齐本身就是一个优化问题并且有自己的目标,因此难以使用其他目标的基于序列距离的端到端学习。例如,学习序列中元素的判别时序表征通常采用不同类别的序列在给定的序列距离下更好地分离的目标函数。这个总体目标的梯度很难通过对齐进行反向传播,因为对齐变量是由另一个优化问题确定的潜在变量。
发明内容
本发明提供了基于时序对齐预测的序列距离度量方法、存储介质及芯片,解决了以上所述的现有基于对齐的序列距离不足的技术问题。
本发明为解决上述技术问题提供了基于时序对齐预测的序列距离度量方法,包括以下步骤:
S100,构建保序对齐预测(OAP)模型;
具体地,输入序列:和是两个长度分别为LX和LY的序列,X的元素xi,i=1,2,…,LX和Y的元素yj,j=1,…,LY位于d维特征空间Rd中;
超参数:变换后的维数d′、时序矩阵权重λ,在计算X和Y之间的距离时,将Y对齐到X;
S200,对OAP模型进行自监督训练;具体地,采用神经网络f通过考虑时序信息直接预测最优对齐的概率T*=f(X,Y),则X和Y之间的OAP距离为:d(X,Y)=T*,D,其中是X和Y中元素之间的成对距离矩阵,e(xi,yj)是两个元素xi和yj之间的向量距离,表示xi和yj对齐的概率。
可选地,所述OAP模型的前向计算过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110773058.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种发电驱动机
- 下一篇:智能囊体天线的形变感知与电磁调控实验装置