[发明专利]一种基于图建模视觉信息的利用问题指导的视频问答方法有效
申请号: | 201911201018.7 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110990630B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 高跃;陈自强;赵曦滨;万海 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/75;G06F16/787;G06F16/738;G06V10/774;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京律谱知识产权代理有限公司 11457 | 代理人: | 孙红颖 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 建模 视觉 信息 利用 问题 指导 视频 问答 方法 | ||
1.一种基于图建模视觉信息的利用问题指导的视频问答方法,其特征在于,该方法包括:
步骤1,获取训练视频的视觉特征V和训练问题的问题特征Q,利用逐项积算法,计算时序注意力特征Qt;其中,步骤1中,具体包括:
步骤11,将所述视觉特征V的维度扩展为Tx300维,计算所述问题特征Q与所述视觉特征V进行逐项积,并通过Softmax分类器计算问题权重Qw;
步骤12,将所述问题权重Qw和所述问题特征Q进行逐项积运算,得到所述时序注意力特征Qt;,所述问题权重Qw的计算公式为:
式中,为所述问题特征Q中的第i个词向量的分数,i=1,2,…,T,T为词向量的个数,T为设定值,为分数权重,为一个可学习参数,为所述视觉特征V和第i个词向量qi的融合参数,qi是所述问题特征Q中第i个词的词向量,为视频权重,为词权重,和均为可学习参数;
步骤2,利用物体检测框架,计算所述训练视频的物体特征VB,根据所述物体特征VB建立显式图模型,并确定显式图建模特征VG;其中,步骤2中,具体包括:
步骤21,根据所述训练视频中每一帧图像,建立一张图,并将所述图中的物体作为图节点,连接任意两个图节点,并将该连线记作图边,生成图邻接矩阵AB x B;
步骤22,使用所述物体特征VB对所述邻接矩阵AB x B进行初始化,其中,所述图节点的初始化特征计算公式为:
f(xk,i)=VB[k][i]
式中,f(xk,i)为第k张图的第i个图节点的初始特征值,VB[k][i]为物体特征VB中第一维取值为k、且第二维取值为i时对应的特征取值;
所述图边的初始化计算公式为:
Ai,j=|f(xk,i)-f(xk,j)|
式中,Ai,j为第k张图中第i个图节点和第j个图节点之间的图边的初始值;
步骤23,将初始化后的邻接矩阵AB x B对应的图边值Ai,j,带入迭代多层神经网络,根据迭代结果更新邻接矩阵AB x B,并将更新后的N个邻接矩阵AB x B进行拼接,采用池化层对拼接后的N个邻接矩阵AB x B进行池化,确定所述显式图建模特征VG;
步骤3,利用所述时序注意力特征Qt和所述显式图建模特征VG,进行第0维点乘运算,生成全局视频特征向量VF;
步骤4,根据所述问题特征Q和所述全局视频特征向量VF,确定全局特征值J,并根据所示全局特征值J和所述训练问题对应的问题答案,优化所述显式图模型的参数,根据优化后的所述参数,更新所述显式图模型;
步骤5,根据更新后的显式图模型,分析待识别视频,确定视频问题的问题答案。
2.如权利要求1所述的基于图建模视觉信息的利用问题指导的视频问答方法,其特征在于,所述迭代多层神经网络的计算公式为:
式中,Ai,j′表示图节点i到图节点j(1=i,j=B)的图边的迭代值,MLP表示多层神经网络单元,f(xi)表示图节点xi的特征,即构造图节点初始值时使用的物体特征VB中第i个物体的特征,其维度为C维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911201018.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:激光雷达测风距离门的自动调节方法
- 下一篇:显示面板和显示装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置