[发明专利]一种语音意图识别方法及系统在审
申请号: | 202011318591.9 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112581963A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 李海洲;肖龙源;李稀敏;廖斌 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/06;G10L15/02 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 蔡稷元 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 意图 识别 方法 系统 | ||
1.一种语音意图识别系统,其特征在于,包括:
语音采集模块,用于采集待识别语音;
特征提取模块,用于根据所述待识别语音提取文本特征向量、韵律特征向量和意图类别特征向量,所述韵律特征向量包括表征语音中音长、音强和音高方面变化的向量中的一种或多种;
特征融合模块,用于将所述文本特征向量、所述韵律特征向量和所述意图类别特征向量进行特征融合,得到意图特征向量;以及根据所述意图特征向量计算出用户意图。
2.根据权利要求1所述的语音意图识别系统,其特征在于,所述待识别语音包括一个以上语种的语音。
3.根据权利要求1所述的语音意图识别系统,其特征在于,所述待识别语音输入前经过降噪和序列提取处理,所述序列提取处理提取的语音特征序列为MFCC特征序列或FBANK特征序列。
4.根据权利要求1所述的语音意图识别系统,其特征在于,所述特征提取模块包括:
语音识别模型,所述语音识别模型输入所述待识别语音,输出所述文本特征向量;
语音韵律模型,所述语音韵律模型输入所述待识别语音,输出所述韵律特征向量;
语音分类模型,所述语音分类模型输入所述待识别语音,输出所述意图类别特征向量。
5.根据权利要求4所述的语音意图识别系统,其特征在于,所述语音识别模型为循环神经网络模型,所述循环神经网络模型为Listen,Attend and Spell模型;所述语音韵律模型为卷积神经网络模型,所述卷积神经网络模型包含3×3卷积核和1×1卷积核;所述语音识别模型为卷积神经网络模型,所述卷积神经网络模型包含3×3卷积核和1×1卷积核。
6.根据权利要求4所述的语音意图识别系统,其特征在于,所述语音识别模型的构建方法包括以下步骤:
收集并截取包含用户意图的用户语音,人工标注得到带有文本标签、韵律标签和意图标签的训练语音;
将所述训练语音转化为训练语音特征序列,输入待训练的所述语音识别模型;
根据所述训练语音特征序列提取训练文本特征向量;
根据所述训练文本特征向量输出音素和字素;
根据所述音素、所述字素和所述文本标签调整所述语音识别模型的模型参数,完成所述语音识别模型的训练。
7.根据权利要求6所述的语音意图识别系统,其特征在于,所述语音韵律模型的构建方法包括以下步骤:
将所述训练语音特征序列输入待训练的所述语音韵律模型;
根据所述训练语音特征序列提取训练韵律特征向量;
根据所述训练韵律特征向量输出韵律标注;
根据所述韵律标注和所述韵律标签调整所述语音韵律模型的模型参数,完成所述语音韵律模型的训练。
8.根据权利要求7所述的语音意图识别系统,其特征在于,所述语音分类模型的构建方法包括以下步骤:
将所述训练语音特征序列输入待训练的所述语音意图分类模型;
根据所述训练语音特征序列提取训练意图类别特征向量;
根据所述训练意图类别特征向量输出意图类别;
根据所述意图类别和所述意图标签调整所述语音分类模型的模型参数,完成所述语音分类模型的训练。
9.根据权利要求8所述的语音意图识别系统,其特征在于,所述特征融合网络的构建方法包括以下步骤:
将所述训练语音特征序列分别输入已经训练好的所述语音识别模型、所述语音韵律模型和所述语音意图分类模型,分别得到所述训练文本特征向量、所述训练韵律特征向量和所述训练意图类别特征向量;
将所述训练文本特征向量、所述训练韵律特征向量和所述训练意图类别特征向量输入待训练的特征融合网络;
根据所述训练文本特征向量、所述训练韵律特征向量和所述训练意图类别特征向量提取意图特征向量;
根据所述意图特征向量输出训练意图;
根据所述训练意图和所述意图标签调整所述特征融合网络的模型参数,完成所述特征融合网络的训练。
10.一种语音意图识别方法,其特征在于,包括以下步骤:
将所述待识别语音输入已经训练好的语音意图识别系统;
根据所述待识别语音得到文本特征向量、韵律特征向量和意图类别特征向量;
将所述文本特征向量、所述韵律特征向量和所述意图类别特征向量进行特征融合,得到意图特征向量;
根据意图特征向量计算出用户意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011318591.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多媒体集线箱分组结构
- 下一篇:一种加速废弃车用轮胎机械切割效率的装置