[发明专利]一种基于语义匹配的多轮对话口语理解方法有效
申请号: | 202010109598.3 | 申请日: | 2020-02-22 |
公开(公告)号: | CN111353029B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 姜明;曹凯强;李鹏飞;张旻;汤景凡 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06N3/04;G06N3/08;G06F40/30 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 匹配 轮对 口语 理解 方法 | ||
1.一种基于语义匹配的多轮对话口语理解方法,其特征在于包括以下步骤:
步骤(1)获取对话数据集并进行预处理,即针对对话数据集中的每个语句正确标注语句意图和对应历史语句;
步骤(2)建立基于语义匹配的多轮对话口语理解架构,确定网络组成部分以及层数和维度,得到口语理解模型;
步骤(3)将步骤(1)预处理后的语句分别输入基于词级别attention的卷积神经网络模型和树状LSTM模型,分别提取语句局部特征和语句语义特征;
步骤(4)将得到的语句局部特征和语句语义特征进行拼接,得到最终单句语句语义表示;
步骤(5)将历史语句语义表示和当前语句语义表示进行两两拼接,输入多层感知机网络模型,基于语义匹配度对历史语句分配权重值;
步骤(6)将历史语句语义表示结合权重值输入对应角色双向LSTM模型,得到角色历史语义影响向量;
步骤(7)拼接2个角色历史语义影响向量得到最终历史语义影响向量;
步骤(8)结合最终历史语义影响向量与当前语句语义表示,输入双向LSTM模型进行意图检测;
步骤(9)将预测的意图与语句对应的真实意图进行对比,计算损失函数,迭代更新网络模型中的参数;
步骤(10)将需测试的语句与对应的历史语句输入训练好的语义匹配网络模型,正确提取历史语义影响向量,结合历史语义影响向量对该语句做意图检测;输出语句对应的意图。
2.根据权利要求1所述的一种基于语义匹配的多轮对话口语理解方法,其特征在于步骤(1)具体过程如下:
(1-1)采用公开的竞赛数据集DSTC4,该数据集为从Skype通话中收集到的有关于旅游信息的对话样本集合,对话人员为35名游客和3名导游;35轮对话总长度共计21小时,包含了31034个句子和273580个单词,21小时长度的对话手动转录成语句并且对对话中的每一个句子标记对话动作和属性标签;
(1-2)将语句对应的对话动作和属性标签正确结合,标注出语句对应的正确意图标签,根据语句顺序标记出语句id;
(1-3)正确标记每一句语句对应的历史语句id数组,将当前语句的前10句作为该语句的历史语句数组,即对应当前语句St,其历史语句数组为[St-10,St-9,St-8,…St-1],将当前语句对应id存入当前语句对应的历史语句数组;若当前语句前的历史语句不足10句,则采用空语句代替;
(1-4)将该35轮对话正确分类,其中20轮对话作为训练集,6轮对话作为验证集,9轮对话作为测试集。
3.根据权利要求1或2所述的基于语义匹配的多轮对话口语理解方法,其特征在于步骤(2)所述的口语理解模型具体过程如下:
口语理解模型主要由3个部分组成,分别为语句语义提取网络、语义匹配打分网络以及历史语义影响向量提取网络,每层的维度为256;语句语义提取网络由基于词级别的attention模型和树状LSTM组成,语义匹配打分网络由多层感知机组成;历史语义影响向量提取网络由2个角色双向LSTM模型组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010109598.3/1.html,转载请声明来源钻瓜专利网。