[发明专利]数据处理方法、装置及介质在审
申请号: | 202111167846.0 | 申请日: | 2021-09-29 |
公开(公告)号: | CN114093341A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 方鹏;刘恺 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G06F16/33;G06F16/68;G06F16/683;G06N3/08 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 房德权 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 介质 | ||
本申请的实施例提供了一种数据处理方法、装置、介质,涉及计算机及人工智能技术领域。该方法包括:获取待处理文本数据,所述待处理文本数据中包括至少一个文本序列;获取与所述待处理文本数据中各个文本序列相对应的角色标签;通过预先训练的声学模型为所述文本序列确定与对应角色标签相适应的声学特征;通过声码器对所述各个文本序列的声学特征进行语音合成,得到与所述待处理文本数据对应的语音数据。本申请实施例的技术方案可以提高针对数据处理的准确度。
技术领域
本申请涉及计算机及人工智能技术领域,具体而言,涉及一种数据处理方法、装置及介质。
背景技术
现有在将文本数据转换为语音数据的场景中,比如将小说文本转换为听书语音的场景,通常是在将文本数据直接转换为语音数据之后,对语音数据进行后处理,例如改变音高、语速和能量等等。然而,这种处理方式会导致语音在听感上有很明显的修饰成分,语音自然度不高。
基于此,如何提数据处理的准确度特别是提高将文本数据转换为语音数据的准确度是亟待解决的技术问题。
发明内容
本申请的实施例提供了一种数据处理方法、装置、计算机程序产品或计算机程序、计算机可读介质,进而至少在一定程度上可以提高针对数据处理的准确度。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种数据处理方法,包括:获取待处理文本数据,所述待处理文本数据中包括至少一个文本序列;获取与所述待处理文本数据中各个文本序列相对应的角色标签;通过预先训练的声学模型为所述文本序列确定与对应角色标签相适应的声学特征;通过声码器对所述各个文本序列的声学特征进行语音合成,得到与所述待处理文本数据对应的语音数据。
根据本申请实施例的一个方面,提供了一种数据处理装置,包括:第一获取单元,被用于获取待处理文本数据,所述待处理文本数据中包括至少一个文本序列;第二获取单元,被用于获取与所述待处理文本数据中各个文本序列相对应的角色标签;确定单元,被用于通过预先训练的声学模型为所述文本序列确定与对应角色标签相适应的声学特征;合成单元,被用于通过声码器对所述各个文本序列的声学特征进行语音合成,得到与所述待处理文本数据对应的语音数据。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:通过预先训练的声学模型为所述文本序列确定与对应角色标签相匹配的韵律特征;按照所述韵律特征,通过所述声学模型为所述文本序列确定声学特征。
在本申请的一些实施例中,基于前述方案,所述装置还包括:第三获取单元,被用于在通过预先训练的声学模型为所述文本序列确定与对应角色标签相匹配的韵律特征之前,获取与多个角色标签相对应的训练文本序列,以及获取与各个训练文本序列相匹配的匹配文本语音;训练单元,被用于通过所述训练文本序列和所述匹配文本语音对待训练声学模型进行训练,得到所述声学模型。
在本申请的一些实施例中,基于前述方案,所述训练单元配置为:从所述匹配文本语音中提取针对所述训练文本序列的实际声学特征;通过所述待训练声学模型预测针对所述训练文本序列的预测声学特征;基于预测声学特征与所述实际声学特征之间的误差,通过梯度反向传递对所述待训练声学模型中的模型参数进行校正,得到所述声学模型。
在本申请的一些实施例中,基于前述方案,所述训练单元配置为:通过所述待训练声学模型,从所述匹配文本语音中提取针对所述训练文本序列的韵律特征,作为与对应角色标签相匹配的匹配韵律特征;按照所述匹配韵律特征,通过所述待训练声学模型预测针对所述训练文本序列的预测声学特征。
在本申请的一些实施例中,基于前述方案,所述待训练声学模型中包括编码器模型和韵律模型,所述训练单元配置为:通过所述编码器模型对所述训练文本序列进行编码,得到所述训练文本序列对应的文本隐层特征;基于所述文本隐层特征,通过所述韵律模型从所述匹配文本语音中提取针对所述训练文本序列的韵律特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111167846.0/2.html,转载请声明来源钻瓜专利网。