[发明专利]信息交互方法、装置、设备及存储介质在审

专利信息
申请号: 202110423719.6 申请日: 2021-04-20
公开(公告)号: CN113127708A 公开(公告)日: 2021-07-16
发明(设计)人: 王永超;苏志铭;刘权;陈志刚;刘聪;胡国平 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G06F16/9032 分类号: G06F16/9032;G06F16/783;G06F16/36;G06F16/332;G06F16/33;G06N3/08
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王雨
地址: 230088 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 交互 方法 装置 设备 存储 介质
【权利要求书】:

1.一种信息交互方法,其特征在于,包括:

获取当前交互场景下的多模态数据,所述多模态数据包括人机交互过程的视频信息、音频信息和/或文本信息;

参考预配置的场景知识图谱库,基于预训练的回复生成模型处理所述多模态数据,输出用于进行交互的回复信息,所述场景知识图谱库中包含与各不同场景一一对应的场景知识图谱;

所述回复生成模型利用跨语种、跨场景的多模态训练数据及所述场景知识图谱库通过无监督的方式训练得到。

2.根据权利要求1所述的方法,其特征在于,所述回复生成模型的训练过程,包括:

获取跨语种、跨场景的多模态训练数据,以及预配置的场景知识图谱库;

将所述多模态训练数据所包含的视频信息、音频信息和文本信息进行对齐;

以对齐后的多模态训练数据作为样本输入,参考所述场景知识图谱库,以预测所述多模态训练数据包含的文本信息中被遮挡的字符为目标,训练回复生成模型。

3.根据权利要求2所述的方法,其特征在于,所述将所述多模态训练数据所包含的视频信息、音频信息和文本信息进行对齐,包括:

对所述视频信息中各视频帧进行特征提取,得到所述视频信息对应的视频特征向量;

对所述视频特征向量进行离散化表示,得到与所述文本信息中各字符一一对齐的视频特征向量;

对所述音频信息中各语音帧进行特征提取,得到所述音频信息对应的音频特征向量;

对所述音频特征向量进行离散化表示,得到与所述文本信息中各字符一一对齐的音频特征向量。

4.根据权利要求2所述的方法,其特征在于,所述以对齐后的多模态训练数据作为样本输入,参考所述场景知识图谱库,以预测所述多模态训练数据包含的文本信息中被遮挡的字符为目标,训练回复生成模型,包括:

利用回复生成模型对输入的所述对齐后的多模态训练数据所包含的视频信息、音频信息和文本信息进行拼接,得到拼接特征;

基于所述拼接特征从所述场景知识图谱库中选择适配的场景知识图谱,并将选择的场景知识图谱表示为知识图谱向量特征;

利用回复生成模型,基于所述拼接特征及所述知识图谱向量特征,预测所述文本信息中被遮挡的字符;

以回复生成模型预测的被遮挡的字符趋近于所述文本信息中真实被遮挡的字符为目标,训练回复生成模型。

5.根据权利要求2所述的方法,其特征在于,所述多模态训练数据还包括位置信息,所述利用回复生成模型对输入的所述对齐后的多模态训练数据所包含的视频信息、音频信息和文本信息进行拼接,得到拼接特征,包括:

利用回复生成模型对输入的所述对齐后的多模态训练数据所包含的视频信息、音频信息、文本信息及所述位置信息进行拼接,得到拼接特征。

6.根据权利要求1所述的方法,其特征在于,所述参考预配置的场景知识图谱库,基于预训练的回复生成模型处理所述多模态数据,输出用于进行交互的回复信息,包括:

利用回复生成模型对所述多模态数据所包含的视频信息、音频信息和/或文本信息进行拼接,得到拼接特征;

基于所述拼接特征从所述场景知识图谱库中选择适配的场景知识图谱,并将选择的场景知识图谱表示为知识图谱向量特征;

利用回复生成模型,基于所述拼接特征及所述知识图谱向量特征,预测并输出用于进行交互的回复信息。

7.根据权利要求6所述的方法,其特征在于,所述多模态数据还包括位置信息;

所述利用回复生成模型对所述多模态数据所包含的视频信息、音频信息和/或文本信息进行拼接,得到拼接特征,包括:

利用回复生成模型对所述多模态数据所包含的位置信息、视频信息、音频信息和/或文本信息进行拼接,得到拼接特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110423719.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top