[发明专利]多任务语音识别模型训练方法、多任务语音识别方法有效
申请号: | 202011327809.7 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112331187B | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 赵飞;黄厚军;钱彦旻 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种多任务语音识别模型训练方法,其中多任务语音识别模型包括卷积层、最大池化层、线性变换层、映射层和多个子任务线性分类层,该方法包括:根据样本音频获取样本音频频谱特征;将样本音频频谱特征输入至卷积层进行卷积处理;通过最大池化层对卷积处理后的所述样本音频频谱特征进行最大池化操作以获得对应于样本音频的句子级别表征信息;通过线性池化层对句子级别表征信息进行线性变化;通过映射层根据线性变化结果对多个子任务线性分类层的参数进行更新。本发明在保证各个子任务性能的前提下,一个模型解决了语音中所包含的多种副信息识别问题,减少了服务端占用的内存和计算量,更加方便的服务用户,满足用户不同的需求。 | ||
搜索关键词: | 任务 语音 识别 模型 训练 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011327809.7/,转载请声明来源钻瓜专利网。