[发明专利]一种语音识别模型的训练、语音识别方法及装置在审
申请号: | 202211042152.9 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115394299A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 谭萍 | 申请(专利权)人: | 兰州文理学院 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/63;G10L15/06;G10L15/00 |
代理公司: | 温州市品创专利商标代理事务所(普通合伙) 33247 | 代理人: | 洪中清 |
地址: | 730000 甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 模型 训练 方法 装置 | ||
1.一种语音识别模型的训练方法,其特征在于:包括如下步骤:
S1、构建包括基础情感词词组、程度词词组、否定和双否定词词组、转折词词组的情感词词典;
S2、基于情感词词典和标准普通话语音大数据训练构建以普通话文本+情感描述为输出项的语音识别模型。
2.如权利要求1所述的一种语音识别模型的训练方法,其特征在于:还包括:基于预设的模板完成用户口音特征的识别,然后根据用户口音特征实现所述的语音识别模型微调的步骤。
3.如权利要求2所述的一种语音识别模型的训练方法,其特征在于:基于预设的模板实现用户音频数据的采集,基于用户音频数据的分析获取用户口音特征,然后构建用户口音特征与标准普通话之间的关联关系,基于该关联关系构建语音校正模型,基于语音校正模型与所述语音识别模型的串联生成新的语音识别模型。
4.如权利要求1所述的一种语音识别模型的训练方法,其特征在于:所述步骤S1中,首先基于爬虫模块在预设的网络基站上定向采集大规模文本信息,然后利用词向量扩充情感词词典的方法对定向采集到的大规模文本进行处理,然后从中自动抽取情感词、程度词、否定和双否定词、转折词,用人工和机器学习相结合的方式构建情感词词典。
5.如权利要求1所述的一种语音识别模型的训练方法,其特征在于:还包括:所述步骤S2中,首先基于情感词词典对标准普通话语音大数据进行自动标注,生成标注语料,然后以标注语料及其对应的普通话文本+情感描述为训练数据训练构建语音识别模型。
6.一种语音识别方法,其特征在于:采用如权利要求1-5任一项所述的训练方法训练所得的语音识别模型实现语音的识别。
7.如权利要求6所述的一种语音识别方法,其特征在于:包括如下步骤:
S1、基于预设的模板完成用户口音特征的识别,然后根据用户口音特征实现所述的语音识别模型微调,生成新的语音识别模型;
S2、基于所述新的语音识别模型实现用户语音的识别,将其转换成普通话文本+情感描述的格式。
8.一种语音识别装置,其特征在于:采用如权利要求6-7任一项所述的语音识别方法实现用户语音的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州文理学院,未经兰州文理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211042152.9/1.html,转载请声明来源钻瓜专利网。