[发明专利]一种基于语境和Transformer的多语言对话机器人系统及其对话方法在审
申请号: | 202110826108.6 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113627196A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 庞文君;杨猛;许红波 | 申请(专利权)人: | 前海企保科技(深圳)有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/58;G06F40/30;G10L15/16;G10L15/26;G10L25/30;G10L25/63;G06K9/62;G06F40/263;G06N3/04;G06N3/08 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 彭西洋;谢亮 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语境 transformer 语言 对话 机器人 系统 及其 方法 | ||
1.一种基于语境和Transformer的多语言对话机器人系统,其特征在于包括:
目标语种识别器模块、语音识别模块、语音情绪识别模块、语音多语言融合器模块以及语音合成模块;
所述目标语种识别器模块对不同的语种进行识别;
所述语音识别模块是根据目标语种选择不同的语音识别引擎并得到识别后的文本问句;
所述语音情绪识别模块基于多模态语音情感分类算法对语音进行情绪识别;
所述语音多语言融合器模块是基于Transformer的端到端神经网络机器翻译引擎将不同语种的源语言文本翻译成不同语种的目标语言并结合语音情绪特征和多语言融合文本答案进行分类输出情绪化翻译结果;
所述语音合成模块将目标语言答案文本通过语音合成输出语音答案。
2.根据权利要求1所述的基于语境和Transformer的多语言对话机器人系统,其特征在于,所述目标语种识别器模块用朴素贝叶斯分类器对不同的语种进行识别。
3.根据权利要求1所述的基于语境和Transformer的多语言对话机器人系统,其特征在于,所述语音识别模块识别语音过程中将多语言融合文本经过BERT文本语义特征编码器处理得到文本语义特征向量。
4.根据权利要求1所述的基于语境和Transformer的多语言对话机器人系统,其特征在于,所述语音情绪识别模块对语音进行情绪识别具体是将音频文件经过MDRE语音情感分类器处理得到音频情绪特征。
5.一种基于语境和Transformer的多语言对话机器人系统的对话方法,其特征在于,包括如下步骤:
S1:目标语种识别器模块将客户的声音信息或文本信息通过目标语种识别器识别出目标语种;
S2:语音识别模块根据目标语种选择不同的语音识别引擎并得到识别后的文本问句;
S3:语音情绪识别模块对语音进行情绪识别,输出音频情绪特征向量;
S4:语音多语言融合器模块将步骤S2中语音识别的结果先通过基于Transformer的基准语言翻译模块得到不同目标语言的答案文本并将多语言答案进行融合,最后融合步骤S3中得到音频情绪特征向量输出目标语言答案文本,即情绪化翻译结果;
S5:语音合成模块将目标语言答案文本通过语音合成输出语音答案。
6.根据权利要求5所述的基于语境和Transformer的多语言对话机器人系统的对话方法,其特征在于,步骤S4具体包括:
S41,多语言融合文本经过文本语义特征编码器得到文本语义特征向量;
S42,对应音频文件经过语音情感分类器得到音频情绪特征向量;
S43,文本语义特征向量和音频情绪特征向量融合,得到融合后的特征;
S44,融合后的特征经过情绪化翻译器得到目标语言答案文本。
7.根据权利要求6所述的基于语境和Transformer的多语言对话机器人系统的对话方法,其特征在于,步骤S41具体包括:
S411,输入源语言通过通用表征器得到源语言句子的通用特征向量;
S412,源语言句子的通用特征向量通过Transformer编码器得到编码器输出向量;
S413,输入目标语言token,判断目标语言;
S414,根据不同的目标语言,将编码器输出向量送到对应的Transformer解码器进行解码,得到目标译文;
具体算法如下:
其中,
k(如1,2,3,…,n)表示语种编号;
t(1,2,3,…,Tk)表示目标语言的序列长度,
yk为对应语种k的参考译文,
Ck为语种k对应的上下文向量。
8.根据权利要求6所述的基于语境和Transformer的多语言对话机器人系统的对话方法,其特征在于,步骤S43具体算法如下:
其中,
A,是音频情绪特征向量;
T,是文本语义特征向量。
9.根据权利要求6所述的基于语境和Transformer的多语言对话机器人系统的对话方法,其特征在于,步骤S44具体算法如下:
C2=EncoderTransformer(concat(Z,T));
其中,
m为目标语言答案文本的序列长度,
θ为模型参数,
yt表示y1,y2,…,yt-1;
C为编码器输出向量,上下文特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于前海企保科技(深圳)有限公司,未经前海企保科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110826108.6/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法