[发明专利]基于语音数据的意图识别方法和装置在审
申请号: | 201910738953.0 | 申请日: | 2019-08-12 |
公开(公告)号: | CN110570853A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 王雅芳;龙翀;张晓彤 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L25/18;G10L15/05;G10L15/18;G10L25/30 |
代理公司: | 11309 北京亿腾知识产权代理事务所(普通合伙) | 代理人: | 孙欣欣;周良玉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征提取 语音数据 特征表示 频谱数据 文本数据 意图识别 综合特征 方法和装置 注意力机制 输出语音 用户意图 指示语音 转换处理 输出 时频 整合 转换 | ||
1.一种基于语音数据的意图识别方法,所述方法包括:
获取用户与机器人客服交互的语音数据,以及所述语音数据经过转换后的文本数据;
至少对所述语音数据进行时频转换处理,得到所述语音数据对应的频谱数据;
将所述频谱数据输入第一特征提取层,通过所述第一特征提取层输出第一特征表示;
将所述文本数据输入第二特征提取层,通过所述第二特征提取层输出第二特征表示;
对所述第一特征表示和所述第二特征表示,采取注意力机制进行整合得到综合特征表示;
将所述综合特征表示输入第三特征提取层,通过所述第三特征提取层输出所述语音数据的意图类别,所述意图类别用于指示所述语音数据所表示的用户意图。
2.如权利要求1所述的方法,其中,所述至少对所述语音数据进行时频转换处理,得到所述语音数据对应的频谱数据,包括:
对所述语音数据进行语音边界检测,以从所述语音数据里识别和消除静音片段,得到所述语音数据的各有效片段;
对所述各有效片段进行时频转换处理,得到所述语音数据对应的频谱数据。
3.如权利要求2所述的方法,其中,所述对所述各有效片段进行时频转换处理,得到所述语音数据对应的频谱数据,包括:
将所述各有效片段进行分帧处理,得到多个帧;
将所述多个帧中各帧对应的时域信号分别转换为各帧对应的频域信号;
基于人的听觉特征提取所述各帧对应的频域信号的特征参数集合,所述特征参数集合作为所述语音数据对应的频谱数据。
4.如权利要求3所述的方法,其中,所述基于人的听觉特征提取所述各帧对应的频域信号的特征参数集合,所述特征参数集合作为所述语音数据对应的频谱数据,包括:
针对所述各帧对应的频域信号中目标频域信号,计算预先配置的三角形滤波器组中各个三角形滤波器对所述目标频域信号滤波后的输出信号;
分别确定各所述三角形滤波器的输出信号分别对应的对数能量;
对所述各对数能量分别进行离散余弦变换,得到所述目标频域信号的特征参数集合,所述各帧对应的频域信号的特征参数集合作为所述语音数据对应的频谱数据。
5.如权利要求4所述的方法,其中,所述频谱数据为所述各帧对应的特征参数集合组成的矩阵;所述第一特征提取层包括卷积神经网络CNN。
6.如权利要求1所述的方法,其中,所述将所述文本数据输入第二特征提取层,通过所述第二特征提取层输出第二特征表示,包括:
获取所述文本数据中的各个字符对应的字符嵌入向量;
至少将各个字符对应的字符嵌入向量输入所述第二特征提取层,通过所述第二特征提取层输出第二特征表示。
7.如权利要求6所述的方法,其中,所述至少将各个字符对应的字符嵌入向量输入所述第二特征提取层,包括:
获取所述各个字符的位置嵌入向量,和/或获取所述各个字符所在词的词性嵌入向量;
对所述字符嵌入向量与所述位置嵌入向量和/或所述词性嵌入向量进行综合处理后输入所述第二特征提取层。
8.如权利要求6所述的方法,其中,所述至少将各个字符对应的字符嵌入向量输入所述第二特征提取层,包括:
至少对各个字符对应的所述字符嵌入向量进行拼接处理,得到嵌入矩阵;
将所述嵌入矩阵输入所述第二特征提取层。
9.如权利要求8所述的方法,其中,所述第二特征提取层包括卷积神经网络CNN。
10.如权利要求1或9所述的方法,其中,所述第三特征提取层包括卷积神经网络CNN。
11.如权利要求1所述的方法,其中,所述意图类别用于指示所述语音数据所表示的用户意图为用户提供信息;
所述方法还包括:
确定所述语音数据对应的标准问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910738953.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务辅助方法、装置及电子设备
- 下一篇:一种智能语音输出方法及装置