[发明专利]一种自动学习优化声学模型的方法有效

专利信息
申请号: 202010551382.2 申请日: 2020-06-16
公开(公告)号: CN111833851B 公开(公告)日: 2021-03-16
发明(设计)人: 唐海江 申请(专利权)人: 杭州云嘉云计算有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/01;G10L15/20;G10L21/0208
代理公司: 杭州杭诚专利事务所有限公司 33109 代理人: 尉伟敏
地址: 311100 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 学习 优化 声学 模型 方法
【权利要求书】:

1.一种自动学习优化声学模型的方法,其特征在于,包括以下步骤:

S1:从数据库中将部分标注数据选入测试池中,将剩余部分标注数据和未标注数据筛选入训练池;

S11:从数据库中随机挑选标注数据选入测试池,剩余的标注数据经过语音增强后选入训练池;

S12:对数据库中未标注数据通过非线性回归算法进行识别率的预测,并将识别率高于阈值的数据放入训练池;

S13:以识别结果充当标注数据,并通过语音增强扩充训练池数据;

S2:将训练池中的数据分批训练,使用测试池中的数据对每次训练产生的声学模型进行识别率测试,将识别率测试结果录入数据库,并生成测试报告;

S3:以识别率最高的声学模型为基础进行循环迭代训练,利用已有数据完成最优声学模型。

2.根据权利要求1所述的一种自动学习优化声学模型的方法,其特征在于,所述的非线性回归算法为:

其中,Y为音频数据的预测识别准确率;为音频数据识别结果的困惑度;为音频数据的音频实时测试速度;为服从均值为零,方差为分布的随机误差;为待估参数;i,j为自然数下标。

3.根据权利要求2所述的一种自动学习优化声学模型的方法,其特征在于,所述的待估参数通过极大然似估计;对于给定的X和待估参数,Y的密度函数为:

n个观测值的对数然似函数为:

最大化上述函数得到待估参数的估计值:

为待估参数的估计值。

4.根据权利要求1所述的一种自动学习优化声学模型的方法,其特征在于,所述的语音增强包括音量增强和语音去噪以及语音转换。

5.根据权利要求1所述的一种自动学习优化声学模型的方法,其特征在于,所述的步骤S2和步骤S3包括以下步骤:

S21:对训练池中的数据进行分批训练,每次训练产生一个声学模型;

S22:利用测试池中的数据对每个声学模型进行整体识别率的测试;

S23:将识别率测试结果录入数据库,并生成测试报告;

S31:比较声学模型的识别率,以识别率最高的声学模型作为基础开始下次训练,并循环迭代;

S32:利用已有数据完成最优识别率的声学模型的训练学习。

6.根据权利要求1所述的一种自动学习优化声学模型的方法,其特征在于,将对所述的声学模型的测试结果录入数据库,并提取重要测试信息,绘制句错误率分布图和引擎测试实时率分布图,自动生成markdown文件测试报告;

所述的提取重要测试信息包括提取测试时间、测试所用模型、测试音频的总字错误率和测试音频总的加权音频的实时测试速度,并提取每个测试音频的句错误率;以音频句错误率为横轴,音频个数占比为纵轴,绘制音频的句错误率分布图;以音频的实时测试速度为横轴,以音频个数占比为纵轴,绘制音频的引擎测试实时率分布图。

7.根据权利要求1所述的一种自动学习优化声学模型的方法,其特征在于,用于完成所述自动学习优化声学模型方法的系统采用docker封装。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010551382.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top