[发明专利]利用知识库渐进时空注意力网络解决视频问答任务的方法有效

专利信息
申请号: 201910080580.2 申请日: 2019-01-28
公开(公告)号: CN109829049B 公开(公告)日: 2021-06-01
发明(设计)人: 赵洲;朱超凡 申请(专利权)人: 杭州一知智能科技有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06F16/783;G06F16/73;G06K9/00;G06N3/04
代理公司: 无锡市汇诚永信专利代理事务所(普通合伙) 32260 代理人: 王闯
地址: 310052 浙江省杭州市萧山*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 知识库 渐进 时空 注意力 网络 解决 视频 问答 任务 方法
【说明书】:

发明公开了一种利用知识库渐进时空注意力网络解决视频问答任务的方法,主要包括如下步骤:1)针对于所给视频、问题,获取问题第n个单词的隐层状态输出、结合了知识库信息的问题隐层状态输出、含有时空注意力信息的视频编码。2)利用得到的问题第n个单词的隐层状态输出、结合了知识库信息的问题隐层状态输出、含有时空注意力信息的视频编码,获取视频问答的答案。相比于一般的视频问答解决方案,本发明利用了知识库渐进时空注意力网络,能够更好地利用问题相关视频帧与问题相关视频画面区域。本发明在视频问答任务中所取得的效果相比于传统的方法更好。

技术领域

本发明涉及视频问答任务,尤其涉及一种利用知识库渐进时空注意力网络解决视频问答任务的方法。

背景技术

视频问答任务是一项十分有挑战性的任务,目前吸引了很多人的关注。在该任务中需要问答系统可以针对于某个特定视频的问题,回答用户的提问。目前视频问答任务仍然是一个较为新颖的任务,对其的研究还不像对图像问答任务那样成熟。对于图像问答任务,一般采用的方法为,将文本内容与图像内容均映射到同一个空间中,之后利用文本与图像内容的联合表达预测所给问题的正确答案。

然而视频是一个具有特定时序信息的静态图像集合,所以视频中隐藏的上下文信息与时间动态信息十分重要,不可以被忽略。此外,在视频中,还有许多视频帧是与所问问题无关的,需要在进行视频问答时给予较低的权重。

此外,在视频问答任务的视频处理时,与问题相关的视频画面区域往往只占整个视频画面区域的一小部分,需要找到问题所关注的视频画面区域。同时,为了提高视频问答的准确性,需要引入相关知识信息。为了解决上述问题,本发明使用知识库渐进时空注意力网络来解决视频问答任务,提高视频问答任务形成回答语句的准确性。

发明内容

本发明的目的在于解决现有技术中的问题,为了克服现有技术对于视频问答无法提供较为准确的回答的问题,本发明提供一种利用知识库渐进时空注意力网络解决视频问答任务的方法。本发明所采用的具体技术方案是:

利用知识库渐进时空注意力网络解决视频问答任务的方法,包含如下步骤:

1.设计一种问题方面的知识库注意力机制对视频问答任务中用户输入的问题进行编码,获取结合了知识库信息的问题隐层状态输出和问题每个单词的隐层状态输出。

2.利用步骤1中获取的结合了知识库信息的问题隐层状态输出,设计一种时空注意力单元对于视频问答任务中的视频进行编码,获取含有时空注意力信息的各个时刻视频编码。

3.利用步骤2获得的含有时空注意力信息的各个时刻视频编码,获取对应的含有时空注意力信息的视频帧第n次隐层状态输出;利用步骤1中获取的结合了知识库信息的问题隐层状态输出、问题每个单词的隐层状态输出与获取的含有时空注意力信息的视频帧第n次循环隐层状态输出,设计一种答案生成器,利用该答案生成器获得视频问答任务的答案。

上述步骤可具体采用如下实现方式:

对于视频问答任务中用户输入的问题,将问题中的各个单词利用单词映射的方式,获得问题中各个单词的映射向量q=(q1,q2,...,qn),其中qt代表问题中的第t个单词的映射向量,n代表问题中的单词个数。将问题中各个单词的映射向量q=(q1,q2,...,qn)依次输入到问题的长短时记忆神经网络单元LSTMq中,获取问题中每个单词对应的问题的长短时记忆神经网络单元LSTMq的隐层状态输出其中代表问题中的第t个单词输入到问题的长短时记忆神经网络单元LSTMq中,获取的对应的隐层状态输出。n代表问题中的单词个数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州一知智能科技有限公司,未经杭州一知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910080580.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top