[发明专利]一种基于多模态学习的视觉对话生成方法及装置有效
申请号: | 202110848206.X | 申请日: | 2021-07-27 |
公开(公告)号: | CN113553418B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 刘安安;张国楷;徐宁;宋丹;靳国庆;张勇东 | 申请(专利权)人: | 天津大学;人民网股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/583;G06F40/211;G06F40/30;G06F40/253;G06N3/0442;G06N3/0464;G06N3/0455;G06N3/048;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多模态学习的视觉对话生成方法及装置,方法包括:利用关键信息进行全局上下文信息语义补充,提取与当前问题相关的历史对话信息,获取精简历史信息;再提取与文本信息相关的视觉区域信息,获取精简视觉信息;将多模态问题相关信息进行融合得到多模态问题相关信息,作为答案推理的重要元素;用文本和视觉的问题相关信息对三元组结构化表征进行语义补全,以补全在多模态信息精简化过程中损失掉的有效信息;将精简历史信息、精简视觉信息、补全后的多模态问题相关信息进行特征融合;将特征融合信息送入解码器中推理得到与当前问题相关的答案。装置包括:处理器和存储器。本发明采用多模态信息交互,对文本和视觉信息发掘细粒度关系信息。 | ||
搜索关键词: | 一种 基于 多模态 学习 视觉 对话 生成 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;人民网股份有限公司,未经天津大学;人民网股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110848206.X/,转载请声明来源钻瓜专利网。