[发明专利]基于局部-整体图推理网络的视频-段落检索方法及系统有效
申请号: | 202110755476.6 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113204674B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 张鹏程 | 申请(专利权)人: | 杭州一知智能科技有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F40/30;G06N5/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 311200 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 局部 整体 推理 网络 视频 段落 检索 方法 系统 | ||
1.一种基于局部-整体图推理网络的视频-段落检索方法,其特征在于,包括以下步骤:
步骤1:将视频划分为片段,提取视频帧特征并编码视频整体层、视频片段层、视频动作层和视频物体层特征;将段落文本划分为句子,提取单词特征并编码段落整体层、段落句子层、段落动作层和段落物体层特征;所述的编码过程采用第一编码器实现;
所述的步骤1具体为:
步骤1.1:将由T帧构成的视频划分为N个视频片段,第i个视频片段包含Ti帧,T1+T2+...+TN=T;将视频中每一帧的帧特征利用Transformer模型进行初始编码,得到编码后的每一个帧特征vi,构成视频特征向量Fv=(v1,v2,...,vi,...,vT)和视频片段特征向量Fc=(Fc1,Fc2,...,Fci,...,FcN);其中,Fci为第i个视频片段特征,是由属于第i个片段的帧特征构成的;
将由L个单词构成的段落划分为M个句子,第i个句子包含Li个单词,L1+L2+...+LM=L;利用Transformer模型对每一个单词进行编码,得到编码后的每一个单词特征ti,构成段落特征向量Ft=(t1,t2,...,ti,...,tL)和段落句子特征向量Fs=(Fs1,Fs2,...,Fsi,...,FsM);其中,Fsi为第i个句子特征,是由属于第i个句子的单词特征构成的;
步骤1.2:对视频-段落相关特征向量基于自注意力机制进行聚合,聚合公式为:
A=softmax(W2σ(W1X+b1)+b2)
其中,A为聚合结果,X为待聚合的特征向量,σ为激活函数,W1、W2为自注意力转换权重矩阵,b1、b2为自注意力转换偏移量;
针对于视频,当X=Fv时,得到视频整体层特征AFv,当X=Fci时,得到视频片段层特征Fci;
针对于段落,当X=Ft时,得到段落整体层特征AFt,当X=Fsi时,得到段落句子层特征Fsi;
步骤1.3:确定视频-段落的动作层和物体层特征:
针对视频,根据视频片段特征向量Fc计算视频动作层特征和视频物体层特征,计算公式为:
AFm=σ(WmFc+bm)
AFo=σ(WoFc+bo)
其中,AFm为视频动作层特征,AFa为视频物体层特征,Wm、Wo为维度转化矩阵,bm、bo为偏移量;
针对段落,标记每一个句子中的动词和名词短语,以及标记每一个名词短语所对应的动词,将每一个动词对应的单词特征ti作为段落动作层特征,将每一个名词短语对应的所有单词特征ti的聚合结果作为段落物体层特征;
步骤2:对视频-段落分别构造视频分层局部图和段落分层局部图,确定图中各个节点的连接边;
步骤3:利用图卷积网络对视频分层局部图和段落分层局部图进行推理,计算局部图中各个连接边的边权重,更新局部图中的节点,得到更新后的分层局部图;
步骤4:对更新后的分层局部图进行分层池化,分别得到池化后的视频局部三层特征和段落局部三层特征;
步骤5:对视频-段落构造整体图:首先将经步骤4分层池化后的局部三层特征进行二次编码,利用二次编码后的片段层/句子层、动作层、物体层节点与初始编码后的整体层节点构造视频整体图和段落整体图,确定图中各个节点的连接边;所述的二次编码过程采用第二编码器实现;
步骤6:利用图卷积网络对视频整体图和段落整体图进行推理,利用步骤3中的方法更新整体中的节点,得到更新后的整体图;
步骤7:对更新后的整体图进行分层池化,分别得到池化后的视频全局四层特征和段落全局四层特征;分别对全局四层特征进行连接,得到视频和段落的最终特征表示;
步骤8:计算视频和段落间的余弦相似度,根据相似度度量结果对由第一编码器、第二编码器和图卷积网络构成的局部-整体图推理网络进行训练;
步骤9:利用训练好的局部-整体图推理网络实现视频-段落检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州一知智能科技有限公司,未经杭州一知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110755476.6/1.html,转载请声明来源钻瓜专利网。