[发明专利]一种基于上下文感知图神经网络的视觉对话生成方法有效

专利信息
申请号: 201910881298.4 申请日: 2019-09-18
公开(公告)号: CN110609891B 公开(公告)日: 2021-06-08
发明(设计)人: 郭丹;王辉;汪萌 申请(专利权)人: 合肥工业大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/583;G06F40/30;G06F40/211;G06F40/284;G06N3/04;G06N3/08
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 上下文 感知 神经网络 视觉 对话 生成 方法
【说明书】:

发明公开了一种基于上下文感知图神经网络的视觉对话生成方法,包括以下步骤:1、视觉对话中文本输入的预处理和单词表的构建;2、对话图像的特征提取以及对话文本的特征提取;3、获取历史对话上下文特征向量;4、构建上下文感知图;5、迭代更新上下文感知图;6、基于当前问题对上下文感知图节点进行注意力处理;7、多模态语义融合及解码生成答案特征序列;8、基于上下文感知图神经网络的视觉对话生成网络模型的参数优化;9、预测答案生成。本发明在视觉对话上构建了上下文感知的图神经网络,能利用更细粒度的文本语义信息来推理图像中不同对象之间的隐含关系,从而提高智能体对问题所预测生成的答案的合理性和准确性。

技术领域

本发明属于计算机视觉技术领域,涉及到模式识别、自然语言处理、人工智能等技术,具体地说是一种基于上下文感知图神经网络的视觉对话生成方法。

背景技术

视觉对话是一种人机交互方法,其目的是让机器智能体与人类能够对给定的日常场景图以问答的形式进行合理正确的自然对话。因此,如何让智能体正确的理解由图像、文本组成的多模态语义信息从而对人类提出的问题给出合理的回答是视觉对话任务的关键。视觉对话目前也是计算机视觉领域热门研究课题之一,其应用场景也非常的广泛,包括:帮助视觉障碍的人群了解社交媒体内容或日常环境、人工智能助力、机器人应用等方面。

随着现代图像处理技术和深度学习的发展,视觉对话技术也得到了巨大的发展,但是仍然面临以下几点问题:

一、智能体在处理文本信息时缺乏对文本特征进行更细粒度的学习。

例如2017年,Jiasen Lu等作者在顶级国际会议Conference and Workshop onNeural Information Processing Systems(NIPS 2017)上发表的文章《Best of BothWorlds:Transferring Knowledge from Discriminative Learning to a GenerativeVisual Dialog Model》中提出的基于历史对话的图像注意力方法,该方法首先对历史对话进行句子层面的注意力处理,然后基于处理后的文本特征对图像特征进行注意力学习,但是该方法在处理当前问题的文本信息时只考虑了句子层面的语义,没有考虑词层面的语义,而在实际提问的句子里面通常只有部分关键词是与预测的答案最相关的。因此,该方法在实际应用时会有一定的局限性。

二、现有方法在处理图像信息时,缺乏对视觉对象之间的语义依赖关系的学习。

例如2019年,Zilong Zheng等作者在顶级国际会议IEEE Conference onComputer Vision and Pattern Recognition(CVPR 2019)上发表的《Reasoning VisualDialogs with Structural and Partial Observations》。这篇文章在视觉对话任务上构建了一个对话图神经网络,图网络中的每一个节点代表一段对话片段,图网络中的边代表不同对话片段之间的语义依赖关系,该方法利用EM算法来更新图网络结果,明确不同对话片段之间的具体语义依赖关系,并更据所更新的图网络来预测最后的答案。虽然这篇文章所提出的方法有效的建模了不同对话片段之间的语义依赖关系,但是该方法只考虑了文本层面的相互依赖关系,而没有去考虑图像信息中不同视觉对象之间的相互依赖关系,使得视觉语义信息没能够进行更细粒度的学习,在最终的预测答案生成上存在局限性。

发明内容

本发明是为了克服现有技术存在的不足之处,提出一种基于上下文感知图神经网络的视觉对话生成方法,以期能为智能体提供充分学习视觉对象间相互依赖关系的视觉语义信息,以及更细粒度的文本语义信息,从而提高智能体对问题所预测生成的答案的合理性和准确性。

本发明为解决技术问题采用如下技术方案:

本发明一种基于上下文感知图神经网络的视觉对话生成方法的特点是按如下步骤进行:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910881298.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top