[发明专利]一种语音标注方法及其系统有效
申请号: | 201910875253.6 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110556093B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 鲁泽茹;胡新辉;徐欣康 | 申请(专利权)人: | 浙江同花顺智富软件有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L13/10;G10L25/03;G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 标注 方法 及其 系统 | ||
本申请实施例公开了一种语音标注方法及系统。所述语音标注方法可以包括以下操作:获取音频数据和对应的音频文本数据;确定所述音频数据的声学特征以及所述音频文本数据的音素标注;基于所述音频数据的所述声学特征、所述音频文本数据的音素标注、以及语音标注校验模型,确定标注异常语句;对所述标注异常语句进行校正以获取满足预设条件的音素标注结果。本申请所披露的方法,可以实现异常标注语句的定位后针对异常语句进行校验更新。可以实现高效的语音标注,也可以大大节省人力,同时提升语音标注的质量。
技术领域
本申请涉及语音处理技术领域,特别地,涉及一种语音标注方法及其系统。
背景技术
近些年来,语音合成技术在技术研发和实际应用方面都得到了飞速发展,合成的音质和自然度上均有了明显的提高。在语音合成领域,语音标注包括标韵律标注和音段标注。其中音段标注具体指标出音素序列并进行切分,音素切分指的是标注各个音素的起始和结束时间。其中标注音素序列这个环节是给录音数据标注发音音素。音素就是身份牌,一旦标错,后果很严重。一般标音的标准是:尊重录音,保证标注的音素和录音的发音一一对应。
在连续语流中,总存在一些规则音变或者不规则音变,导致所读不是原来词典音素。中文里的多音字,声调变化,儿化音,轻音等都是雷区,自动化标音很难做到精准,一般需要人工标注,才能达到音素精标。
目前,音素标注一般是先完成标注,然后人工听录音一一校验发音。但是,在数据量较大的情况下,往往会出现标注数据生成效率低,人工成本较高的问题,而且难免有遗漏和标错的情况存在。
发明内容
本申请的一个方面提供一种语音标注方法。所述语音标注方法可以包括以下操作:获取音频数据和对应的音频文本数据;确定所述音频数据的声学特征以及所述音频文本数据的音素标注;基于所述音频数据的所述声学特征、所述音频文本数据的音素标注、以及语音标注校验模型,确定标注异常语句;以及基于一次或以上迭代以校正所述标注异常语句,获取满足预设条件的音素标注结果。
在一些实施例中,所述确定所述音频文本数据的音素标注可以包括以下操作:利用至少一种分词算法,对所述音频文本数据进行分词;以及基于转换算法,确定分词后的所述音频文本数据的音素标注。
在一些实施例中,所述确定分词后的所述音频文本数据的音素标注可以包括以下操作:基于所述分词后的音频文本数据所处的上下文场景匹配所述分词后的音频文本的音素标注。
在一些实施例中,所述基于所述声学特征、所述音素标注、以及语音标注校验模型获取标注异常语句可以包括以下操作:将所述音频数据的所述声学特征和对应的所述音频文本数据的音素标注输入所述语音标注校验模型进行强制对齐;以及基于所述强制对齐结果,获取所述标注异常语句。
在一些实施例中,所述强制对齐结果包括所述音频数据的声学特征与所述音频文本数据的音素标注之间的匹配概率。所述获取所述标注异常语句可以包括以下操作:确定所述匹配概率是否小于预设阈值;若所述匹配概率小于所述预设阈值,确定所述匹配概率对应的标识,并基于所述标识获取所述标注异常语句。
在一些实施例中,所述语音标注校验模型包括基于Kaldi的GMM-HMM三音素声学模型,或基于HTK的GMM-HMM单音素或三音素声学模型。
在一些实施例中,所述对所述标注异常语句进行校正以获取满足预设条件的音素标注结果可以包括以下操作:获取对所述标注异常语句更新后的音素标注;将所述标注异常语句的声学特征和对应的更新后的音素标注输入语音标注校验模型,进行强制对齐;基于所述强制对齐结果,确定所述更新后的音素标注是否正确;若所述更新后的音素标注错误,则重复进行所述标注异常语句的更新的音素标注获取及正确性判定过程,直至满足所述预设条件为止。
在一些实施例中,所述音频数据的所述声学特征包括线性预测系数、倒谱系数、梅尔频率倒谱系数、梅尔滤波器组、或感知线性预测系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江同花顺智富软件有限公司,未经浙江同花顺智富软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910875253.6/2.html,转载请声明来源钻瓜专利网。