[发明专利]用于文本处理的方法、装置、设备和存储介质在审
申请号: | 202210773089.X | 申请日: | 2022-06-30 |
公开(公告)号: | CN115114933A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 章峻珲;鲍吴迪;马泽君 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/151;G06F40/289;G06N20/00;G06N3/04;G06N3/08 |
代理公司: | 北京世辉律师事务所 16093 | 代理人: | 马明月 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文本 处理 方法 装置 设备 存储 介质 | ||
根据本公开的实施例,提供了用于文本处理的方法、装置、设备和存储介质。在该方法中,基于第一语言的原文本中的多个文本单元生成多个第一特征表示,多个第一特征表示指示相应文本单元的语义;将多个第一特征表示与第二特征表示结合以形成特征表示序列,第二特征表示指示多个文本单元中的各个文本单元是否为文本单元组的边界;以及基于特征表示序列,生成第二语言的转换文本。以此方式,可以显著提高文本转换的准确度和效率。
技术领域
本公开的示例实施例总体涉及计算机领域,特别地涉及用于文本处理的方法、装置、设备和计算机可读存储介质。
背景技术
文本转语音(Text-to-speech,简称为TTS)是一种语音合成应用,其将文本转换成自然语音输出。TTS系统一般包括前端系统和后端系统。前端系统负责把输入的文本转化为一些中间结果,诸如文本分词分句、韵律(用于控制说话节奏和语调等)、音素的信息等等,然后将这些中间结果发送给后端系统。后端系统根据已有的录音数据生成尽量符合这些结果的声音。例如,后端系统可以首先从音频中总结出一些音频特征(例如,梅尔谱),然后使用训练算法来训练用于将前端结果映射到这些音频特征的转换器,即声学模型。后端系统可以用声码器将这些音频特征还原成可以听到的声音。
汉语方言TTS系统可以用于将方言文本转换成方言语音。然而,该系统通常只能由方言专家使用,因为汉语方言与汉语普通话的字词、惯用语、语法和用法往往有很大差别,即使是本土人士也很难输入正确的语句。
发明内容
在本公开的第一方面,提供了一种文本处理的方法。该方法包括基于第一语言的原文本中的多个文本单元生成多个第一特征表示,多个第一特征表示指示相应文本单元的语义;将多个第一特征表示与第二特征表示结合以形成特征表示序列,第二特征表示指示多个文本单元中的各个文本单元是否为文本单元组的边界;以及基于特征表示序列,生成第二语言的转换文本。
在本公开的第二方面,提供了一种文本处理的方法。该方法包括获取训练文本对,训练文本对包括第一语言的原文本和第二语言的目标文本;利用转换模型,将原文本转换为第二语言的转换文本,包括:基于原文本中的多个文本单元生成多个第一特征表示,多个第一特征表示指示相应文本单元的语义,将多个第一特征表示与第二特征表示结合形成特征表示序列,第二特征表示指示多个文本单元中的各个文本单元是否为文本单元组的边界,以及基于特征表示序列,生成转换文本;以及至少基于转换文本与目标文本之间的差异,来训练转换模型。
在本公开的第三方面,提供了一种文本处理的装置。该装置包括特征生成模块,被配置为基于第一语言的原文本中的多个文本单元生成多个第一特征表示,多个第一特征表示指示相应文本单元的语义;特征结合模块,被配置为将多个第一特征表示与第二特征表示结合以形成特征表示序列,第二特征表示指示多个文本单元中的各个文本单元是否为文本单元组的边界;以及转换模块,被配置为基于特征表示序列,生成第二语言的转换文本。
在本公开的第四方面,提供了一种文本处理的装置。该装置包括文本获取模块,被配置为获取训练文本对,训练文本对包括第一语言的原文本和第二语言的目标文本;文本转换模块,被配置为利用转换模型,将原文本转换为第二语言的转换文本,文本转换模块进一步被配置为:基于原文本中的多个文本单元生成多个第一特征表示,多个第一特征表示指示相应文本单元的语义,将多个第一特征表示与第二特征表示结合形成特征表示序列,第二特征表示指示多个文本单元中的各个文本单元是否为文本单元组的边界,以及基于特征表示序列,生成转换文本;以及训练模块,被配置为至少基于转换文本与目标文本之间的差异,来训练转换模型。
在本公开的第五方面,提供了一种电子设备。该设备包括至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面或第二方面的方法。
在本公开的第六方面,提供了一种计算机可读存储介质。介质上存储有计算机程序,程序被处理器执行时实现第一方面或第二方面的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210773089.X/2.html,转载请声明来源钻瓜专利网。