[发明专利]一种面向出行领域的人机多轮对话方法有效
申请号: | 201810779805.9 | 申请日: | 2018-07-16 |
公开(公告)号: | CN109063035B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 赵铁军;郑德权;林先辉;曹海龙;朱聪慧;徐冰;杨沐昀 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/211;G06F40/289;G06F40/295;G06K9/62 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 出行 领域 人机 轮对 方法 | ||
1.一种面向出行领域的人机多轮对话方法,其特征在于,该方法的具体步骤为:
步骤一、对用户的当前问句进行规范化处理,再对当前问句中存在明确指示代词或缺乏句子子结构的情况,根据与用户之前交互中涉及的槽位信息,对当前问句中的指示代词和缺失的句子子结构进行替代或填充;得到处理后的当前问句;
步骤二、采用DAN、CNN或BLSTM模型得到步骤一处理后的当前问句的意图信息:将步骤一处理后的当前问句输入DAN、CNN或BLSTM模型;DAN、CNN或BLSTM模型的输出经过softmax操作得到当前问句的意图概率,将概率最大的意图作为当前问句的意图信息;
步骤三、将步骤一处理后的当前问句输入引入意图特征词表的BLSTM-CRF模型,得到当前问句的槽位信息;
所述步骤三中将步骤一处理后的当前问句输入引入意图特征词表的BLSTM-CRF模型,得到当前问句的槽位信息的具体过程为:
所述BLSTM-CRF模型包括输入层、前向LSTM层、后向LSTM层和CRF输出层;BLSTM-CRF模型的训练过程如下:
BLSTM-CRF模型的参数设置,字向量维度为50维,前向LSTM层和后向LSTM层的隐藏层维度为128,意图特征维度为10,dropout为0.5,mini-batch大小设置为64,迭代次数为B4,patience设置为5,即经过5次测试准确率均无提升时,停止训练;采用Adam学习率更新方法,学习率设置为0.001;
将步骤一处理后的当前问句输入训练好的BLSTM-CRF模型的输入层,输入层输出当前问句的字向量表示为X=(X1,X2,…,XN),X1为当前问句的第一个字的字向量,N是当前问句中字的总个数;
构建意图特征词表,意图特征词表包括每个意图中相应的特征词;根据意图特征词表中所包括的意图特征词对步骤一处理后的当前问句进行标注,得到标注后的序列集合Y=(y1,y2,…,yN),y1,y2,…,yN′分别为标注后得到的序列,N′是集合Y中的序列总个数;
标注后的序列集合Y=(y1,y2,…,yN′)经过训练好的BLSTM-CRF模型的输入层操作得到各序列的向量表示,分别将每个序列的向量表示与当前问句的字向量表示进行拼接,将拼接后的结果作为训练好的BLSTM-CRF模型的前向LSTM层和后向LSTM层的输入;
拼接前向LSTM层和后向LSTM层的输出,并采用随机初始化对前向LSTM层和后向LSTM层的参数矩阵进行初始化,得到每个时刻的隐藏层状态H1,H2,…,HT,其中,H1、H2和HT分别代表第1时刻、第2时刻和第T时刻的隐藏层状态;
前向LSTM层和后向LSTM层输出的拼接结果为Q,拼接结果Q的大小为2*N*h,h是隐藏层的维度,拼接结果Q经过CRF输出层得到状态矩阵P;
通过状态矩阵P,计算出标注后的序列集合Y中每个序列yk的概率得分s(X,yk),k=1,2,…,N′;
状态矩阵P通过softmax操作得到标注后的序列集合Y中的每个序列yk的概率P(yk|X),其中;
计算序列集合Y中的每个序列yk的对数概率log(p(yk|X)):
将对数概率最大的序列yk作为当前问句的槽位信息;
步骤四、将历史的槽位信息和当前问句的槽位信息作为输入,确定当前的对话状态信息,并结合当前问句的意图信息确定下一步的回复策略;
步骤五、根据步骤四确定的回复策略选择对应的模板回复给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810779805.9/1.html,转载请声明来源钻瓜专利网。