[发明专利]一种语音意图识别方法及系统在审
申请号: | 202011318591.9 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112581963A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 李海洲;肖龙源;李稀敏;廖斌 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/06;G10L15/02 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 蔡稷元 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 意图 识别 方法 系统 | ||
本发明公开了一种语音意图识别方法及系统。该系统包括语音采集模块,用于采集待识别语音;特征提取模块,用于根据待识别语音提取文本特征向量、韵律特征向量和意图类别特征向量;特征融合模块,用于将文本特征向量、韵律特征向量和意图类别特征向量进行特征融合,得到意图特征向量;以及根据意图特征向量计算出用户意图。本发明基于深度学习技术从待识别语音中获得声学和语言信息,结合声学特征中的韵律表示,最终实现稳定准确的用户意图预测。
技术领域
本发明涉及语音识别技术领域,特别是一种语音意图识别方法及系统。
背景技术
随着智能设备中语音操作界面的日益普及,语音交互成为人与机器之间沟通交流的重要桥梁。语音意图识别技术则是实现语音交互的关键技术之一。语音意图识别技术,是指机器根据输入的语音推断其含义或意图,来决定响应的内容。
现有的语音意图识别系统架构由两个部分组成,第一个部分是自动语音识别模块,用于将输入的语音解码为文本转录,第二个部分是自然语言理解模块,用于将意图分类为自动语音识别的输出文本。
但现有的语音意图识别系统存在一定局限性:只考虑语音中的音素信息,因此无法准确地推断出说话人的意图。
发明内容
本发明为解决上述问题,提供了一种语音意图识别方法及系统,基于深度学习技术从待识别语音中获得声学和语言信息,结合声学特征中的韵律表示,最终实现稳定准确的用户意图预测。
为实现上述目的,本发明采用的技术方案为:
一种语音意图识别系统,包括:语音采集模块,用于采集待识别语音;特征提取模块,用于根据所述待识别语音提取文本特征向量、韵律特征向量和意图类别特征向量,所述韵律特征向量包括表征语音中音长、音强和音高方面变化的向量中的一种或多种;特征融合模块,用于将所述文本特征向量、所述韵律特征向量和所述意图类别特征向量进行特征融合,得到意图特征向量;以及根据所述意图特征向量计算出用户意图。
优选的,所述待识别语音包括一个以上语种的语音。
优选的,所述待识别语音输入前经过降噪和序列提取处理,所述序列提取处理提取的语音特征序列为MFCC特征序列或FBANK特征序列。
优选的,所述特征提取模块包括:语音识别模型,所述语音识别模型输入所述待识别语音,输出所述文本特征向量;语音韵律模型,所述语音韵律模型输入所述待识别语音,输出所述韵律特征向量;语音分类模型,所述语音分类模型输入所述待识别语音,输出所述意图类别特征向量。
优选的,所述语音识别模型为循环神经网络模型,所述循环神经网络模型为Listen,Attend and Spell模型;所述语音韵律模型为卷积神经网络模型,所述卷积神经网络模型包含3×3卷积核和1×1卷积核;所述语音识别模型为卷积神经网络模型,所述卷积神经网络模型包含3×3卷积核和1×1卷积核。
优选的,所述语音识别模型的构建方法包括以下步骤:收集并截取包含用户意图的用户语音,人工标注得到带有文本标签、韵律标签和意图标签的训练语音;将所述训练语音转化为训练语音特征序列,输入待训练的所述语音识别模型;根据所述训练语音特征序列提取文本特征向量;根据所述文本特征向量输出音素和字素;根据所述音素、所述字素和所述文本标签调整所述语音识别模型的模型参数,完成所述语音识别模型的训练;
优选的,所述语音韵律模型的构建方法包括以下步骤:将所述训练语音特征序列输入待训练的所述语音韵律模型;根据所述训练语音特征序列提取韵律特征向量;根据所述韵律特征向量输出韵律标注;根据所述韵律标注和所述韵律标签调整所述语音韵律模型的模型参数,完成所述语音韵律模型的训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011318591.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多媒体集线箱分组结构
- 下一篇:一种加速废弃车用轮胎机械切割效率的装置