[发明专利]基于异质图神经网络的文本视觉问答实现方法在审
申请号: | 202110370266.5 | 申请日: | 2021-04-07 |
公开(公告)号: | CN113094484A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 高晨雨;朱琪;王鹏 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 吕湘连 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于异质图神经网络的文本视觉问答实现方法。该方法中网络结构分为问题自我注意力模型、异质图注意力模型和全局‑局部注意力应答模型三部分。问题自我注意力模型将一个具有T个单词的问题Q,通过预训练的BERT网络得到输入单词对应的融合全文语义信息的词向量;异质图注意力模型从图像中构建异质图,采用注意力机制,使用不同的问题特征更新异质图的不同部分,得到问题条件下对象和文本的异质图特征;全局‑局部注意力应答模型采用迭代的方式,得到函数预测答案。本方法中,二分支评价函数使得生成的答案可以同时兼顾OCR标记和一般文本标记,从而提高了应答的准确率,最终达到高精度的效果。 | ||
搜索关键词: | 基于 异质图 神经网络 文本 视觉 问答 实现 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110370266.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种三维立体环境监测系统
- 下一篇:一种可调节长度的手臂康复机器人