[发明专利]一种跨媒体层次化深度视频问答推理框架有效
申请号: | 202011499931.2 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112527993B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 余婷;来炳;钱璐 | 申请(专利权)人: | 浙江财经大学东方学院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/783;G06F40/205;G06F40/30;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 314408 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种跨媒体层次化深度视频问答推理框架。本发明步骤:1、利用记忆组件保存视频的全局语义信息,通过多轮记忆更新迭代得到浅层推理机。2、基于浅层推理机,构建深层推理机,将视频深层语义解析下的多模态子成分嵌入不同模态的记忆卡槽,形成空间记忆和时序记忆。3、构建多模态记忆协同推理框架,利用来自对象和动作的多模态证据执行更为精细的推理。4、进行多模态记忆动态融合,利用浅层推理机的输出作为监视哨,引导下层不同模态记忆内容的权重分配,通过框架中的记忆动态融合模块动态融合不同模态的记忆,该记忆动态融合模块的输出将作为回答模块的输入去预测最佳答案。本发明推理框架能够在视频问答数据集上取得显著的效果。 | ||
搜索关键词: | 一种 媒体 层次 深度 视频 问答 推理 框架 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江财经大学东方学院,未经浙江财经大学东方学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011499931.2/,转载请声明来源钻瓜专利网。