[发明专利]基于生成式听觉模型的端到端汉语方言识别系统和方法有效
申请号: | 201811228307.1 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109256118B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 齐诏娣;马勇;顾明亮;金赟 | 申请(专利权)人: | 江苏师范大学 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06;G10L15/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 221000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开的一种基于生成式听觉模型的端到端汉语方言识别系统和方法,涉及语音识别技术领域。该汉语方言识别系统,用CNN模拟听觉模型对方言时域声音波形进行特征提取,随后将提取出的固定长度特征序列输入至RNN中,再连接全连接层后进行softmax,用于预测方言类别。本发明公开的一种基于生成式听觉模型的端到端汉语方言识别系统和方法,可有效提高NN方言识别过程中的抗噪性能,并因其提取了原始声音的深层次语言特征以及其模型具有一定的关注模型信息,所以在一定程度上也提高了方言识别率。 | ||
搜索关键词: | 基于 生成 听觉 模型 端到端 汉语 方言 识别 系统 方法 | ||
【主权项】:
1.一种基于生成式听觉模型的端到端汉语方言识别系统,其特征在于,其网络结构依次为输入层、生成式听觉模型、RNN层、全连接层以及softmax层,所述生成式听觉模型使用卷积神经网络模拟听觉模型,使用固定核函数从原始声音时间波形中提取出深层次语言特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏师范大学,未经江苏师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811228307.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种语音数据处理方法及装置
- 下一篇:用于改进车辆语法的语音识别用户宏