[发明专利]一种基于辅助网络的智能对话生成方法有效
申请号: | 201910428886.2 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110297894B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 向阳;赵宇晴 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33;G06K9/62;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 辅助 网络 智能 对话 生成 方法 | ||
1.一种基于辅助网络的智能对话生成方法,其特征在于,包括以下步骤:
1)根据对话生成任务需求建立相应的对话语句数据集;
2)建立对话生成模型,采用对话语句数据集对对话生成模型进行预训练,基于seq2seq模型生成对话生成模型,所述的seq2seq模型采用编码器-译码器架构,所述的对话生成模型采用循环神经网络构建编码器和译码器处理输入语句(x1,…xt…,xT)和生成输出语句(y1,…yt…,yT′),则有:
ht=sigm(Whxxt+Whhht-1)
yt=Wyhht
其中,ht为每一时间步t的隐藏层状态,Whx为输入层参数矩阵,Whh为隐藏层参数矩阵,Wyh为输出层参数矩阵,p(y1,…,yT′|x1,…,xT)为基于输入X的输出Y的条件概率;
3)建立辅助网络专家语料库以及辅助网络数据集;
4)建立辅助网络模型,采用辅助网络数据集进行预训练,所述的辅助网络模型采用多项逻辑斯谛回归进行多分类,所述的辅助网络模型起到分类器或过滤器的作用,用以将整个词表中的词语分为当前时刻可用和当前时刻不可用两种状态,则有:
p(x)=f(x)
其中,x为辅助网络的输入,p表示辅助网络的输出概率,该输出概率为二分类结果或多分类结果;
5)采用训练后对话生成模型以及训练后辅助网络模型的预训练参数对基于辅助网络的智能对话生成模型进行参数初始化,再进行联合训练,或者直接进行联合训练,在训练过程中同时扩展辅助网络训练数据集,直至对话生成模型和辅助网络模型均收敛;
6)根据训练后的基于辅助网络的智能对话生成模型结合辅助网络专家语料库进行判定,将概率最高的词语作为当前时刻的最终输出词语。
2.根据权利要求1所述的一种基于辅助网络的智能对话生成方法,其特征在于,所述的步骤3)中,建立辅助网络数据集包括以下两种方式:
采用训练后的对话生成模型获取译码器的隐藏层状态、上一时刻的输出词语以及当前时刻的ground_truth词语或当前时刻的非ground_truth词语或当前时刻的生成词语作为特征形成正负样本,最终构成辅助网络数据集;
采用训练好的对话生成模型获取译码器的隐藏层状态和上一时刻的输出词语作为特征形成词表大小的多分类样本,最终构成辅助网络数据集。
3.根据权利要求1所述的一种基于辅助网络的智能对话生成方法,其特征在于,所述的步骤6)中,当根据具体对话任务需求或有其它辅助网络训练数据集的来源则可不进行对话生成模型的预训练,并且,对于辅助网络模型,当有其它对话规则来源或依据具体对话任务需求也可不进行预训练,对话生成模型和辅助网络模型在联合训练过程中采用交替训练方式,直至对话生成模型和辅助网络模型均收敛。
4.根据权利要求1所述的一种基于辅助网络的智能对话生成方法,其特征在于,根据人类专家经验构建一系列经验规则作为辅助网络专家语料库,并采用相同方式进行扩展。
5.根据权利要求1所述的一种基于辅助网络的智能对话生成方法,其特征在于,所述的步骤6)具体为:
将对话生成模型的译码器在当前时刻的隐藏层状态和上一时刻的生成词语作为辅助网络模型的输入,根据辅助网络模型的输出区分出当前时刻可用的词语和当前时刻不可用的词语,最终将在辅助网络模型判定的当前时刻可用的词语中,结合辅助网络专家语料库选择对话生成模型生成的概率最高的词语作为当前时刻的最终输出词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910428886.2/1.html,转载请声明来源钻瓜专利网。