[发明专利]一种多模态信息处理方法、装置、电子设备和存储介质在审
申请号: | 202110239408.4 | 申请日: | 2021-03-04 |
公开(公告)号: | CN113762319A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 袁韶祖;陈蒙;刘瑞雪 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30;G06N3/04 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多模态 信息处理 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种多模态信息处理方法、装置、电子设备和存储介质,所述方法包括:从获取到的多模态信息中提取第一模态特征和第二模态特征;所述第一模态特征和所述第二模态特征为两种不同模态的特征;基于注意力机制,利用所述第二模态特征,对所述第一模态特征进行注意力加权处理,得到第一加权模态特征;对所述第一加权模态特征和所述第二模态特征进行多模态分解双线性池化处理,得到双模态向量;根据所述双模态向量,生成所述多模态信息对应的意图分类结果。
技术领域
本申请涉及计算机技术,涉及但不限于一种多模态信息处理方法、装置、 电子设备和存储介质。
背景技术
相关技术中,多模态信息处理的解决方式主要有:基于单模态语言的分类 或匹配模型的处理方式,如TextCNN(Text Convolutional Neural Networks,利 用卷积神经网络进行文本分类)等;基于单模态图像分类模型的处理方式,如 ResNet(Residual Network,残差网络)等。
多模态信息处理中如果采用单模态(即只使用图像或者文本)方法进行解 决,便浪费了其他模态的信息,得到的意图分类结果的准确率不高。
发明内容
有鉴于此,本申请实施例提供一种多模态信息处理方法、装置、电子设备 和存储介质。
第一方面,本申请实施例提供一种多模态信息处理方法,所述方法包括: 从获取到的多模态信息中提取第一模态特征和第二模态特征;所述第一模态特 征和所述第二模态特征为两种不同模态的特征;基于注意力机制,利用所述第 二模态特征,对所述第一模态特征进行注意力加权处理,得到第一加权模态特 征;对所述第一加权模态特征和所述第二模态特征进行多模态分解双线性池化 处理,得到双模态向量;根据所述双模态向量,生成所述多模态信息对应的意 图分类结果。
第二方面,本申请实施例提供一种多模态信息处理装置,包括:提取模块, 用于从获取到的多模态信息中提取第一模态特征和第二模态特征;所述第一模 态特征和所述第二模态特征为两种不同模态的特征;加权模块,用于基于注意 力机制,利用所述第二模态特征,对所述第一模态特征进行注意力加权处理, 得到第一加权模态特征;池化模块,用于对所述第一加权模态特征和所述第二 模态特征进行多模态分解双线性池化处理,得到双模态向量;第一生成模块, 用于根据所述双模态向量,生成所述多模态信息对应的意图分类结果。
第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述 存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实 现本申请实施例任一所述多模态信息处理方法中的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算 机程序,该计算机程序被处理器执行时实现本申请实施例任一所述多模态信息 处理方法中的步骤。
本申请实施例中,通过基于注意力机制,利用第二模态特征,对第一模态 特征进行注意力加权处理,得到第一加权模态特征,再对第一加权模态特征和 第二模态特征进行多模态分解双线性池化处理,得到双模态向量,进而生成意 图分类结果,从而能够使得第一模态特征和第二模态特征进行充分的交互融合, 获得更准确的意图分类结果。
附图说明
图1为本申请实施例一种多模态信息处理方法的流程示意图;
图2为本申请实施例一种基于自上而下注意力机制的神经网络模型的结构 示意图;
图3为本申请实施例一种MFB的结构示意图;
图4为本申请实施例一种多模态信息的示意图;
图5为本申请实施例一种意图分类结果和知识点的匹配关系示意图;
图6为本申请实施例一种意图卡片的示意图;
图7为本申请实施例一种意图分类结果的生成方法示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110239408.4/2.html,转载请声明来源钻瓜专利网。