[发明专利]一种语音数据处理方法及其设备有效

申请号：	201610827020.5	申请日：	2016-09-18
公开（公告）号：	CN107844470B	公开（公告）日：	2021-04-30
发明（设计）人：	康亮	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F40/30	分类号：	G06F40/30;G06F40/56
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;熊永强
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音数据处理方法及其设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音数据处理方法，其特征在于，所述方法由语音数据处理设备执行，包括：

在出境游场景下，获取用户终端上报的源语音数据，并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合；所述同音文本数据集合是由所述源语音数据的多个版本的文本数据所确定的；所述多个版本的文本数据均为源文本数据库中的同音文本数据；所述源文本数据库是基于训练语料进行训练时对不同口音进行分析以及学习后所确定的；

对所述源语音数据的上下文信息进行解析以生成解析结果；

根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据；

将所述源文本数据翻译处理为目标语言的目标文本数据，生成所述目标文本数据的目标语音数据，对所述目标文本数据和所述目标语音数据进行输出；所述目标语言是由所述用户终端上报的终端位置信息所确定的；所述目标文本数据是基于所述目标语言的语法定义规则对初始翻译文本数据进行修正后所得到的；所述初始翻译文本数据是对所述源文本数据进行翻译处理时所得到的；所述目标语音数据用于表示基于所述目标文本数据所生成的语音数据。

2.根据权利要求1所述的方法，其特征在于，所述在出境游场景下，获取用户终端上报的源语音数据之前，还包括：

在存储有至少一个文本数据的源文本数据库中，设置所述至少一个文本数据中各文本数据的映射语义信息。

3.根据权利要求2所述的方法，其特征在于，所述对所述源语音数据的上下文信息进行解析以生成解析结果，包括：

解析所述源语音数据的上下文信息以获取所述上下文信息中的关键字段信息；

判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述关键字段信息相匹配的第一映射语义信息，并在判断后生成解析结果。

4.根据权利要求2所述的方法，其特征在于，所述对所述源语音数据的上下文信息进行解析以生成解析结果，包括：

解析所述源语音数据的上下文信息以获取所述上下文信息的语义规则信息；

判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述语义规则信息相匹配的第一映射语义信息，并在判断后生成解析结果。

5.根据权利要求3或4所述的方法，其特征在于，所述根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据，包括：

当所述解析结果表示为存在相匹配的第一映射语义信息时，获取所述第一映射语义信息对应的同音文本数据，并将所述第一映射语义信息对应的同音文本数据确定为所述源语音数据对应的源文本数据。

6.根据权利要求1所述的方法，其特征在于，所述将所述源文本数据翻译处理为目标语言的目标文本数据，生成所述目标文本数据的目标语音数据，对所述目标文本数据和所述目标语音数据进行输出，包括：

获取所上报的终端位置信息，确定所述终端位置信息对应的目标语言；