[发明专利]文本信息处理方法及装置有效

申请号：	202010172575.7	申请日：	2020-03-12
公开（公告）号：	CN111785248B	公开（公告）日：	2023-06-23
发明（设计）人：	薛浏蒙;宋伟;武执政	申请（专利权）人：	北京汇钧科技有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G06F40/279;G06F40/30
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	朱颖;臧建明
地址：	100176 北京市大兴区北京经济***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本信息处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种文本信息处理方法及装置，该方法包括：获取文本信息中每个音素对应的音素向量和每个音素对应的语义向量；获取在上一时刻输出的第一语义信息，第一语义信息为文本信息中的部分文本信息对应的语义信息，部分文本信息为已经转换为语音信息的文本信息；根据第一语义信息、每个音素对应的音素向量和每个音素对应的语义向量，确定当前时刻对应的上下文向量；根据上下文向量和第一语义信息，确定当前时刻的语音信息。用于使得根据语音信息合成的语音音频具有更好的韵律、更稳定的音质。

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种文本信息处理方法及装置。

背景技术

目前，对文本信息进行机器学习，可以得到该文本信息对应的语音。

在相关技术中，对文本信息进行机器学习得到音频信息的过程包括：获取文本信息对应的音素信息，对音素信息进行编码处理得到语义信息，对语义信息进行学习得到上下文向量，进而根据上下文向量合成语音。

在上述过程中，对语义信息进行学习得到上下文向量的过程中，得到的上下文向量不准确，导致合成的语音的音质较差。

发明内容

本发明实施例提供一种文本信息处理方法及装置，用于使得根据语音信息合成的语音音频具有更好的韵律、更稳定的音质。

第一方面，本发明实施例提供一种文本信息处理方法，包括：

获取文本信息中每个音素对应的音素向量和每个音素对应的语义向量；

获取在上一时刻输出的第一语义信息，第一语义信息为文本信息中的部分文本信息对应的语义信息，部分文本信息为已经转换为语音信息的文本信息；

根据第一语义信息、每个音素对应的音素向量和每个音素对应的语义向量，确定当前时刻对应的上下文向量；