[发明专利]一种自动学习优化声学模型的方法有效

专利信息
申请号: 202010551382.2 申请日: 2020-06-16
公开(公告)号: CN111833851B 公开(公告)日: 2021-03-16
发明(设计)人: 唐海江 申请(专利权)人: 杭州云嘉云计算有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/01;G10L15/20;G10L21/0208
代理公司: 杭州杭诚专利事务所有限公司 33109 代理人: 尉伟敏
地址: 311100 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 学习 优化 声学 模型 方法
【说明书】:

本发明公开了一种自动学习优化声学模型的方法。为了克服现有技术优化声学模型的过程繁琐耗时,成本大且准入门槛高的问题;本发明包括以下步骤:S1:从数据库中将部分标注数据选入测试池中,将剩余部分筛选入训练池;S2:将训练池中的数据分批训练,以识别率最高的声学模型进行循环迭代训练,利用已有数据完成最优声学模型;S3:利用测试池对完成的最优声学模型进行测试,测试结果录入数据库,并生成测试报告。本方案通过语音增强等手段扩充标注数据,减少人工标注成本,为提高语音识别结果的准确率提供关键基础。自动训练、测试完成循环迭代,降低声学模型优化过程的耗时和成本,降低准入门槛。

技术领域

本发明涉及一种计算机领域,尤其涉及一种自动学习优化声学模型的方法。

背景技术

语音识别技术就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。这项技术可以提供比如自动客服、自动语音翻译、命令控制、语音验证码等多项应用。近年来,随着人工智能的兴起,语音识别技术在理论和应用方面都取得大突破,开始从实验室走向市场,已逐渐走进我们的日常生活。现在语音识别己用于许多领域,主要包括语音识别听写器、语音寻呼和答疑平台、自主广告平台,智能客服等。

语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。目前,模式匹配原理已经被应用于大多数语音识别系统中。

语音识别算法目前虽已日趋完善,但语音识别系统的性能受多方面影响,如口语化,方言,短词,语速,音量,噪声等。在不同的应用场景中,往往遇到各种各样的问题影响引擎的最终识别结果。

传统的机器学习方法在优化声学模型时,首先需要收集大量数据,然后对数据进行标注、提取特征、选择特征,然后根据所选特征训练模型、对模型进行测试评估,最后部署到应用上,以解决基础声学模型的口音识别问题。

例如,一种在中国专利文献上公开的“一种优化语音识别声学模型的方法及系统”,其公告号CN103165129B,包括:A1、采用语音识别声学模型对输入的语音段进行识别得到识别结果,以及获取所述输入的语音段的标注脚本;A2、将所述识别结果和标注脚本进行比对,获取被识别错误的语音段;A3、以所述被识别错误的语音段及其标注脚本更新语音识别声学模型的训练数据;A4、以更新后的训练数据对所述语音识别声学模型进行重训练。

该方法的声学优化过程需要大量的标注语料,耗费大量的人力和时间;优化声学模型的过程繁琐耗时,且准入门槛高。

发明内容

本发明主要解决现有技术优化声学模型的过程繁琐耗时,成本大且准入门槛高的问题;提供一种自动学习优化声学模型的方法,自动训练、自动测试和迭代优化,降低声学模型优化过程的耗时和成本,降低准入门槛。

本发明的上述技术问题主要是通过下述技术方案得以解决的:

本发明包括以下步骤:

S1:从数据库中将部分标注数据选入测试池中,将剩余部分标注数据和未标注数据筛选入训练池;

S2:将训练池中的数据分批训练,使用测试池中的数据对每次训练产生的声学模型进行识别率测试,将识别率测试结果录入数据库,并生成测试报告;

S3:以识别率最高的声学模型为基础进行循环迭代训练,利用已有数据完成最优声学模型。

本方案自动训练、自动测试,每次训练生成一个声学模型便会测试该模型的整体识别率,下一次训练以之前已经训练好的模型中识别率最高的模型为基础模型开始训练,如此循环迭代,自动学习,降低声学模型优化过程的耗时和成本,降低准入门槛。

作为优选,所述的步骤S1包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010551382.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top