[发明专利]基于鉴别性训练的定制语音唤醒优化方法及系统有效
申请号: | 201710343427.5 | 申请日: | 2017-05-16 |
公开(公告)号: | CN107123417B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 俞凯;陈哲怀 | 申请(专利权)人: | 上海交通大学;苏州思必驰信息科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14;G10L15/22 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于鉴别性训练的定制语音唤醒优化方法及系统,在给定带标注的声学数据后,结合初始的基于神经网络的声学模型,通过神经网络前向传播得到逐帧声学概率;结合标注序列及逐帧声学概率,得到标注唤醒词的建模概率;利用在大量文本上统计得到的音素级语言模型,构建为相应的搜索网络;基于音素级语言模型的搜索空间和逐帧声学模型可以进行唤醒词竞争项建模,得到后验概率;结合唤醒词竞争项建模和标注唤醒词建模,进行声学模型的鉴别性训练;通过鉴别性训练得到的声学模型采用基于唤醒词置信度与自动估计阈值的比较以判别是否唤醒。 | ||
搜索关键词: | 基于 鉴别 训练 定制 语音 唤醒 优化 方法 系统 | ||
【主权项】:
一种基于鉴别性训练的定制语音唤醒优化方法,其特征在于,包括以下步骤:步骤1)在给定带标注的声学数据后,结合初始的基于神经网络的声学模型,通过神经网络前向传播得到逐帧声学概率;步骤2)结合标注序列及逐帧声学概率,得到标注唤醒词的建模概率;步骤3)利用在大量文本上统计得到的音素级语言模型,构建为相应的搜索网络;步骤4)基于音素级语言模型的搜索空间和逐帧声学模型可以进行唤醒词竞争项建模,得到后验概率;步骤5)结合唤醒词竞争项建模和标注唤醒词建模,进行声学模型的鉴别性训练;步骤6)通过鉴别性训练得到的声学模型采用基于唤醒词置信度与自动估计阈值的比较以判别是否唤醒。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;苏州思必驰信息科技有限公司,未经上海交通大学;苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710343427.5/,转载请声明来源钻瓜专利网。