[发明专利]一种利用基于图的特定目标网络解决视频问答问题的方法及其系统有效
申请号: | 202010795120.0 | 申请日: | 2020-08-10 |
公开(公告)号: | CN111652357B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 赵洲;何金铮;顾茅 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62;G06F16/78;G06F16/332 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用基于图的特定目标网络解决视频问答问题的方法及其系统,属于视频问答文本生成领域。主要包括如下步骤:1)针对于一组视频、问题、答案训练集,训练一个跨模态编码器,学习出视频信息和问题信息的联合表征。2)对于跨模态编码器编码完成的得到视频问题联合表达的神经网络的输出,通过一个解答模块根据数据集的不同问题训练不同的解码器,输出针对于视频和问题联合表达的自然语言答案。本发明采用一个更加细粒度的基于图的关系敏感的编码器来获得视频问答中的目标关系,采用一个特定目标的时序编码器来捕获特定目标的同质动态视觉线索,采用轨迹优化算法,减轻了复杂场景下目标检测的不足,有效提升了视频问答的性能。 | ||
搜索关键词: | 一种 利用 基于 特定 目标 网络 解决 视频 问答 问题 方法 及其 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010795120.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种VR沉浸效果的实时评估方法和评估系统
- 下一篇:机器人臂的主动反向驱动