[发明专利]对话生成方法、视频评论方法、装置、设备及存储介质在审
申请号: | 202010462032.9 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111625660A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 魏瑶;高俊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/432 | 分类号: | G06F16/432 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘星雨;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 生成 方法 视频 评论 装置 设备 存储 介质 | ||
本发明提供了一种基于人工智能的对话处理方法、基于人工智能的视频评论方法、装置、电子设备及计算机可读存储介质;方法包括:分别对输入语句以及多媒体信息进行编码处理,得到对应输入语句的编码向量、以及对应多媒体信息的编码向量;对输入语句的编码向量以及多媒体信息的编码向量进行编码处理,得到多媒体信息的特征向量;对输入语句的编码向量以及多媒体信息的特征向量进行融合处理,得到融合向量;对融合向量进行解码处理,得到用于回复输入语句的回复语句。通过本发明,能够自动并准确地生成对话,增强参与视频的互动的吸引力。
技术领域
本发明涉及人工智能技术,尤其涉及一种基于人工智能的对话处理方法、基于人工智能的视频评论方法、装置、电子设备及计算机可读存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
相关技术中缺乏模拟真实用户就多媒体信息进行对话的有效方案,主要依赖于人工方案,例如根据多媒体信息的内容,对关于多媒体信息进行讨论的输入语句进行回复,使得回复语句能够承接输入语句。但是,这种方式效率太低,无法适用于线上应用。
发明内容
本发明实施例提供一种基于人工智能的对话处理方法、基于人工智能的视频评论方法、装置、电子设备及计算机可读存储介质,能够自动并准确和高效地形成针对多媒体信息的对话。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种基于人工智能的对话生成方法,包括:
分别对输入语句以及多媒体信息进行编码处理,得到对应所述输入语句的编码向量、以及对应所述多媒体信息的编码向量;
对所述输入语句的编码向量以及所述多媒体信息的编码向量进行编码处理,得到所述多媒体信息的特征向量;
对所述输入语句的编码向量以及所述多媒体信息的特征向量进行融合处理,得到融合向量;
对所述融合向量进行解码处理,得到用于回复所述输入语句的回复语句。
上述技术方案中,所述对所述融合向量进行解码处理,得到用于回复所述输入语句的回复语句,包括:
对所述融合向量以及已经生成的词语进行线性映射,得到所述下一个待生成词语的概率分布;
将所述概率分布中最大概率所对应的词语确定为下一个生成的词语;
根据生成词语的顺序,将所述生成词语组成用于回复所述输入语句的回复语句。
上述技术方案中,所述方法还包括:
通过对话生成模型,对训练样本中输入语句的编码向量以及多媒体信息的编码向量进行还原处理,得到对应所述训练样本中输入语句的各还原词语的概率;
根据所述对应所述训练样本中输入语句的各还原词语的概率,构建所述对话生成模型的编码损失函数;
通过所述对话生成模型,对所述训练样本中的融合向量进行预测处理,得到每个生成词语的概率;
根据所述每个生成词语的概率,构建所述对话生成模型的解码损失函数;
将所述编码损失函数与所述解码损失函数相加,以得到所述对话生成模型的整体损失函数;
更新所述对话生成模型的参数直至所述整体损失函数收敛,将所述整体损失函数收敛时所述对话生成模型的更新的参数,作为训练后的所述对话生成模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010462032.9/2.html,转载请声明来源钻瓜专利网。