[发明专利]一种语音数据处理方法及其设备有效
申请号: | 201610827020.5 | 申请日: | 2016-09-18 |
公开(公告)号: | CN107844470B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 康亮 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/56 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 数据处理 方法 及其 设备 | ||
1.一种语音数据处理方法,其特征在于,所述方法由语音数据处理设备执行,包括:
在出境游场景下,获取用户终端上报的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;所述同音文本数据集合是由所述源语音数据的多个版本的文本数据所确定的;所述多个版本的文本数据均为源文本数据库中的同音文本数据;所述源文本数据库是基于训练语料进行训练时对不同口音进行分析以及学习后所确定的;
对所述源语音数据的上下文信息进行解析以生成解析结果;
根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据;
将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出;所述目标语言是由所述用户终端上报的终端位置信息所确定的;所述目标文本数据是基于所述目标语言的语法定义规则对初始翻译文本数据进行修正后所得到的;所述初始翻译文本数据是对所述源文本数据进行翻译处理时所得到的;所述目标语音数据用于表示基于所述目标文本数据所生成的语音数据。
2.根据权利要求1所述的方法,其特征在于,所述在出境游场景下,获取用户终端上报的源语音数据之前,还包括:
在存储有至少一个文本数据的源文本数据库中,设置所述至少一个文本数据中各文本数据的映射语义信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述源语音数据的上下文信息进行解析以生成解析结果,包括:
解析所述源语音数据的上下文信息以获取所述上下文信息中的关键字段信息;
判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述关键字段信息相匹配的第一映射语义信息,并在判断后生成解析结果。
4.根据权利要求2所述的方法,其特征在于,所述对所述源语音数据的上下文信息进行解析以生成解析结果,包括:
解析所述源语音数据的上下文信息以获取所述上下文信息的语义规则信息;
判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述语义规则信息相匹配的第一映射语义信息,并在判断后生成解析结果。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据,包括:
当所述解析结果表示为存在相匹配的第一映射语义信息时,获取所述第一映射语义信息对应的同音文本数据,并将所述第一映射语义信息对应的同音文本数据确定为所述源语音数据对应的源文本数据。
6.根据权利要求1所述的方法,其特征在于,所述将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出,包括:
获取所上报的终端位置信息,确定所述终端位置信息对应的目标语言;
将所述源文本数据翻译处理为目标语言的初始翻译文本数据;
基于所述目标语言的语法定义规则修改所述初始翻译文本数据以生成目标文本数据;
生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。
7.根据权利要求6所述的方法,其特征在于,所述将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出之后,还包括:
将所述目标文本数据存储至所述终端位置信息对应翻译文本数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610827020.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息管理系统及方法
- 下一篇:断层潜在力学活动性预测方法和装置