[发明专利]车载环境下语音交互意图识别及过程管理方法在审
申请号: | 202210371357.5 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114462407A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 苏生 | 申请(专利权)人: | 电子科技大学长三角研究院(湖州) |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/30;G06F16/35;G06K9/62;G06N3/04;G10L15/22;G10L15/26 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 李英 |
地址: | 313000 浙江省湖州市西塞*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载 环境 语音 交互 意图 识别 过程 管理 方法 | ||
1.车载环境下语音交互意图识别及过程管理方法,其特征在于:包括以下步骤:
一、车载环境下的语音交互用户意图分类:
二、结合车载环境语音交互意图类型的训练数据准备:
使用人工采集结合程序半自动生成的方式准备神经网络的训练数据;
三、基于BIO格式的训练数据词性标注:
基于BIO格式的数据集,在数据集中将每一个字或词标注为“B-A”、“I-A”或者“O”;
四、构建关键信息标注的双向长短期记忆神经网络级联条件随机场模型:
利用条件随机场模型与长短期记忆神经网络进行级联,形成双向长短期记忆神经网络级联条件随机场模型,对基于BIO格式的数据集进行标签化标注;
五、基于标注结果,利用文本卷积神经网络模型进行单句意图识别:
文本卷积神经网络模型将CNN应用到文本分类任务中,利用多个不同大小的卷积核来提取句子中的关键信息,实现单句意图识别;
六、动作执行器执行操作:
根据用户意图执行在系统中预设定的操作;
七、进行对话管理:
系统在与用户交互的过程中不断根据历史交互信息与当前输入短句决定下一步应该执行的最优动作。
2.根据权利要求1所述的车载环境下语音交互意图识别及过程管理方法,其特征在于:步骤一中,将车载环境下的语音交互用户意图分为五大类和多个小类,五大类包括播放音频、导航、打电话、回答、控制。
3.根据权利要求1所述的车载环境下语音交互意图识别及过程管理方法,其特征在于:步骤三中,针对数据集做如下预处理:
(1)从数据集中按行获取数据,分别得到短句和其对应的标签,构造句子序列和标签序列,这两个序列长度保持一致;
(2)将短句序列中的空白符、换行符以及标点符号等特殊字符删除;
(3)根据词典得到词对应的整数索引,根据索引可以查询到每个词对应的词向量,神经网络的输入内容即为词向量序列。
4.根据权利要求1所述的车载环境下语音交互意图识别及过程管理方法,其特征在于:步骤五中,文本卷积神经网络模型的输入层接收一个固定长度的文本序列;然后后面的卷积层使用多个尺寸不同的卷积核对输入序列进行滑动卷积操作,这些卷积核将相邻的字或词转化成一个数值;接着后面的池化层从多个卷积核返回的卷积后的值中选取最大值输入到全连接层,最终通过softmax进行分类。
5.根据权利要求4所述的车载环境下语音交互意图识别及过程管理方法,其特征在于:步骤五中,卷积操作的具体计算方法为:
式中
6.根据权利要求1所述的车载环境下语音交互意图识别及过程管理方法,其特征在于:步骤七中,对话管理如下式所示:
式中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(湖州),未经电子科技大学长三角研究院(湖州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210371357.5/1.html,转载请声明来源钻瓜专利网。