[发明专利]一种面向出行领域的车载多轮对话方法在审
申请号: | 201910225111.5 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109933659A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 李鹏华;朱庆元;方昳凡;黄子恒;易和阳 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 置信 意图识别 多轮 策略生成 状态跟踪 跟踪器 出行 构建 人工智能技术 网络结构设计 设计数据库 对话领域 对话状态 概率分布 记忆网络 交叉验证 理论意义 用户提供 用户体验 专用状态 查询 人性化 回报 并行 学习 全局 应用 网络 | ||
1.一种面向出行领域的车载多轮对话方法,其特征在于:该方法基于深度学习,所述深度学习包括:基于长短期记忆网路的意图识别、与卷积神经网络绑定的循环神经网络置信状态跟踪、深度增强学习下的策略网络;该方法包括以下步骤:
S1、获取出行领域下的多伦对话训练数据集,意图识别模型训练数据集与置信状态跟踪模型训练数据集,构建长短期记忆网络;
S2、对于给定的意图识别模型训练数据集,在超参数选择约束下,对学习模型进行训练与交叉验证,最终生成模型用于识别用户意图,并将结果提交给用于对话管理的策略网络;
S3、搭建与卷积神经网络绑定的循环神经网络进行置信状态跟踪任务,对每个槽构建专用状态跟踪器,利用卷积神经网络提取特征向量,通过循环神经网络计算对话置信状态;
S4、通过数据驱动训练置信跟踪器,并设计数据库查询方法进行查询;
S5、通过意图类别,置信状态和数据库真值向量构建对话状态,设计总体回报函数与Q网络,搭建深度增强学习模型;
S6、通过调整Q网络对迭代的Bellman目标参数进行求解,利用出行领域的多轮对话数据集进行端到端的模型训练;
S7、依据对话状态的全局置信概率分布与策略回报选择所有可能的并行对话路径,最终生成下一时刻对话动作。
2.根据权利要求1所述的一种面向出行领域的车载多轮对话方法,其特征在于:在步骤S1中,对多轮对话中的每一轮对话进行编码,得到对话的编码向量zt是在对话轮次t时,输入为的分布式向量表示,即输入后,得到的一堆预测概率向量;构建长短期记忆网络,并将最后一步输出层作为出行领域中的不同意图的概率表示:
其中it表示输入门,ft表示遗忘门,ot表示输出门,ci-1,ci表示储存信息的短期忆状态,Wxc,Whc是可训练的参数,hi-1表示隐藏层,LSTM(Long Short-Term Memory)是长短期记忆网络。
3.根据权利要求2所述的一种面向出行领域的车载多轮对话方法,其特征在于:在步骤S3中,采用与卷积神经网络绑定的循环神经网络进行置信状态跟踪任务,用于维护和更新车载多轮对话的状态;
对每个槽构建专用状态跟踪器,每个跟踪器都由一个带有卷积神经网络特征提取器与Jordan型循环神经网络构成;在每轮的话语语境中进行建模,设计特征向量是两个卷积神经网络派生特征的连接,一个是处理t轮的用户输入ut,另一个是处理在t-1轮的系统响应st-1,其计算公式如下:
其中,尺寸为N的独热向量表示使用者输入ut和系统响应st-1;为了使跟踪器知道何时将去词汇化应用于一个槽或者值,槽值专用卷积神经网络运算不仅提取顶级句子表示,而且还提取由去词汇化标记的位置确定的中间类n-gram嵌入;在每个话语中,如果观察到多个匹配,则对相应的嵌入求和;如果特定的槽或者值不匹配,则用零填充空的n-gram嵌入;在每个卷积操作之前用句子填充句子的两边,实现跟踪去词汇化的标记的位置;向量的数量由每层的过滤器大小决定。
4.根据权利要求3所述的一种面向出行领域的车载多轮对话方法,其特征在于:循环神经网络更新规则为:
其中向量ws,矩阵Ws,偏置项bs和b′s以及标量gφ,s是参数,是直到t轮时用户没有提及该值的概率;每个值v的循环神经网络权重组合在一起,在更新每个pre-softmax激活函数时改变特征
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910225111.5/1.html,转载请声明来源钻瓜专利网。