[发明专利]训练基于htk语音模型的方法在审
申请号: | 202111270534.2 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113936646A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 张蓓蕾;李帆;黄建青;刘文婷;戴志晃;陆彬;杨晓华;张锦涛 | 申请(专利权)人: | 上海航天电子通讯设备研究所 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 基于 htk 语音 模型 方法 | ||
本发明是一种训练基于htk的语音模型方法,该训练语音模型的方法包括生成wordnet、生成字典、生成mfcc、初始化hmm模型、训练hmm模型模块。该发明通过脚本快速完成生成hmm语音模型需要的中间输入文件,并顺序将脚本文件执行命令及htk工具包的调用命令写入批处理文件,实现自动化训练语音模型的过程。该训练方法采用脚本关联训练步骤的方式,顺序运行执行与调用命令,大大提高了训练语音模型的速度,降低了手动编辑输入文件过程中的错误率。
技术领域
本发明涉及一种训练基于htk语音模型的方法。
背景技术
语音模型训练是语音识别系统的功能模块。为了便于嵌入式语音识别中语音模型的开发,语音识别系统在开发前期,根据提供的语音样本文件完成语音模型的训练,生成基于c语言的语音模型。现有的手动编辑htk训练工具需要的输入文件和调用htk训练工具,造成了语音模型训练速度慢、步骤繁琐、易出错的问题,无法满足快速更换嵌入式语音识别系统中语音模型的需求。
发明内容
本发明提供一种训练基于htk语音模型的方法。
本发明提供一种训练基于htk的语音模型方法,包括:
采用编写相应脚本处理基于htk的训练工具需要的输入文件,运行cmd命令调用训练步骤中需要的基于htk的训练工具,顺序将脚本文件执行命令和基于htk训练工具的调用命令写入批处理文件。
进一步的,上述方法中,采用编写相应脚本处理基于htk的训练工具需要的输入文件,运行cmd命令调用训练步骤中需要的基于htk的训练工具,顺序将脚本文件执行命令和基于htk训练工具的调用命令写入批处理文件,包括:
运用脚本生成基于htk训练工具需要的输入文件,顺序调用脚本文件执行命令和htk工具包的调用命令,自动完成训练语音模型功能。
进一步的,上述方法中,运用脚本生成基于htk训练工具需要的输入文件,顺序调用脚本文件执行命令和htk工具包的调用命令,自动完成训练语音模型功能,包括:
编写脚本,以完成原来的手动操作步骤;
基于编写的脚本,批处理完成自动化模型训练。
进一步的,上述方法中,编写脚本,以完成原来的手动操作步骤,包括:
第一步:编写grammar.py脚本,执行生成基于htk训练工具HParse的输入文件grammar,运行基于htk的训练工具HParse生成wordnet,完成源文件转换成词网络;
第二步:编写wordlist.py和beep.py脚本,执行生成基于htk训练工具HDMan的输入文件wordlist和beep,运行基于htk训练工具HDMan完成字典的生成;
第三步:调用基于htk训练工具中的perl脚本,执行生成基于htk工具的HLEd的输入文件trainwords.mlf和trainprompts,运行基于htk训练工具HLEd生成发音序列;
第四步:编写codetrain.py脚本,执行生成基于htk训练工具HCopy的输入文件codetrain.scp,运行基于htk训练工具HCopy完成语音样本特征参数的生成;
第五步:执行基于htk训练工具HCompV生成hmm初始化模型;
第六步:执行基于htk训练工具HERest训练多次模型,编写脚本处理在多次训练过程中需要手动操作的步骤,完成循环过程的自动化;
第七步:编写脚本,将hmm语言模型文件转换成嵌入式语音识别系统中的基于c语言的语音模型。
进一步的,上述方法中,基于编写的脚本,批处理完成自动化模型训练,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航天电子通讯设备研究所,未经上海航天电子通讯设备研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111270534.2/2.html,转载请声明来源钻瓜专利网。