[发明专利]一种基于双视觉注意力网络的视觉对话生成方法在审

申请号：	201910881305.0	申请日：	2019-09-18
公开（公告）号：	CN110647612A	公开（公告）日：	2020-01-03
发明（设计）人：	郭丹;王辉;汪萌	申请（专利权）人：	合肥工业大学
主分类号：	G06F16/31	分类号：	G06F16/31;G06F16/332;G06F16/583
代理公司：	34101 安徽省合肥新安专利代理有限责任公司	代理人：	陆丽莉;何梅生
地址：	230009 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于双视觉注意力网络的视觉对话生成方法，包括以下步骤：1、视觉对话中文本输入的预处理和单词表的构建；2、对话图像的特征提取以及对话文本的特征提取；3、基于当前问题信息对历史对话信息进行注意力处理；4、双视觉特征各自独立的注意力处理；5、双视觉特征相互交叉的注意力处理；6、视觉特征的优化处理；7、多模态语义融合及解码生成答案特征序列；8、基于双视觉注意力网络的视觉对话生成网络模型的参数优化；9、预测答案生成。本发明能为智能体提供更完整、更合理的视觉语义信息，以及更细粒度的文本语义信息，从而提高智能体对问题所预测生成的答案的合理性和准确性。
搜索关键词：	视觉特征视觉注意力视觉注意力特征提取智能体对话预处理答案解码参数优化答案生成对话文本对话信息特征序列网络模型文本语义问题信息优化处理语义融合语义信息多模态细粒度预测构建合理性网络图像中文
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于双视觉注意力网络的视觉对话生成方法，其特征是按如下步骤进行：/n步骤1、视觉对话中文本输入的预处理和单词表的构建：/n步骤1.1、获取视觉对话数据集，所述视觉对话数据集中包含句子文本和图像；/n对所述视觉对话数据集中所有的句子文本进行分词处理，得到分割后的单词；/n步骤1.2、从分割后的单词中筛选出词频率大于阈值的所有单词，并构建单词索引表Voc；再对所述索引表Voc中的每一个单词进行one-hot编码，得到one-hot向量表O＝[o

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于合肥工业大学，未经合肥工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910881305.0/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于双视觉注意力网络的视觉对话生成方法在审

专利文献下载