[发明专利]训练基于htk语音模型的方法在审
申请号: | 202111270534.2 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113936646A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 张蓓蕾;李帆;黄建青;刘文婷;戴志晃;陆彬;杨晓华;张锦涛 | 申请(专利权)人: | 上海航天电子通讯设备研究所 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 基于 htk 语音 模型 方法 | ||
1.一种训练基于htk的语音模型方法,其特征在于,包括:
采用编写相应脚本处理基于htk的训练工具需要的输入文件,运行cmd命令调用训练步骤中需要的基于htk的训练工具,顺序将脚本文件执行命令和基于htk训练工具的调用命令写入批处理文件。
2.如权利要求1所述的训练基于htk的语音模型方法,其特征在于,采用编写相应脚本处理基于htk的训练工具需要的输入文件,运行cmd命令调用训练步骤中需要的基于htk的训练工具,顺序将脚本文件执行命令和基于htk训练工具的调用命令写入批处理文件,包括:
运用脚本生成基于htk训练工具需要的输入文件,顺序调用脚本文件执行命令和htk工具包的调用命令,自动完成训练语音模型功能。
3.如权利要求2所述的训练基于htk的语音模型方法,其特征在于,运用脚本生成基于htk训练工具需要的输入文件,顺序调用脚本文件执行命令和htk工具包的调用命令,自动完成训练语音模型功能,包括:
编写脚本,以完成原来的手动操作步骤;
基于编写的脚本,批处理完成自动化模型训练。
4.如权利要求3所述的训练基于htk的语音模型方法,其特征在于,编写脚本,以完成原来的手动操作步骤,包括:
第一步:编写grammar.py脚本,执行生成基于htk训练工具HParse的输入文件grammar,运行基于htk的训练工具HParse生成wordnet,完成源文件转换成词网络;
第二步:编写wordlist.py和beep.py脚本,执行生成基于htk训练工具HDMan的输入文件wordlist和beep,运行基于htk训练工具HDMan完成字典的生成;
第三步:调用基于htk训练工具中的perl脚本,执行生成基于htk工具的HLEd的输入文件trainwords.mlf和trainprompts,运行基于htk训练工具HLEd生成发音序列;
第四步:编写codetrain.py脚本,执行生成基于htk训练工具HCopy的输入文件codetrain.scp,运行基于htk训练工具HCopy完成语音样本特征参数的生成;
第五步:执行基于htk训练工具HCompV生成hmm初始化模型;
第六步:执行基于htk训练工具HERest训练多次模型,编写脚本处理在多次训练过程中需要手动操作的步骤,完成循环过程的自动化;
第七步:编写脚本,将hmm语言模型文件转换成嵌入式语音识别系统中的基于c语言的语音模型。
5.如权利要求4所述训练基于htk的语音模型方法,其特征在于,基于编写的脚本,批处理完成自动化模型训练,包括:
第八步:初始化脚本运行环境;
第九步:执行运行脚本命令,将训练模型过程中手动处理文件过程转成自动化处理过程;
第十步:第九步生成的文件作为本步的输入文件,调用相应的基于htk训练工具,输出语音模型训练需要的过程中间文件;
第十一步:根据模型训练过程步骤循环执行第九步和第十步,直到生成语言模型文件;
第十二步:执行脚本命令生成嵌入式识别系统中基于c语言的语音模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航天电子通讯设备研究所,未经上海航天电子通讯设备研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111270534.2/1.html,转载请声明来源钻瓜专利网。