[发明专利]一种数据处理方法、装置和用于数据处理的装置在审

申请号：	201811603538.6	申请日：	2018-12-26
公开（公告）号：	CN111369978A	公开（公告）日：	2020-07-03
发明（设计）人：	周盼	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/14;G10L15/16;G10L15/22;G10L15/26
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	莎日娜
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据处理方法装置用于
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括：根据多语言声学模型，确定语音信息中语音帧的语言类型；其中，所述多语言声学模型为根据至少两种语言类型的声学数据训练得到；根据所述语音帧的语言类型对应的解码网络，对所述语音帧进行解码，以得到所述语音帧的第一解码结果；根据所述第一解码结果，确定所述语音信息对应的识别结果。本发明实施例可以提高语音识别的准确率。

技术领域

本发明涉及计算机技术领域，尤其涉及一种数据处理方法、装置和用于数据处理的装置。

背景技术

语音识别技术，也被称为ASR(Automatic Speech Recognition，自动语音识别)，其目标是将语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。

在日常的语言表达中，可能会出现多种语言混合表达的情况。以中文和英文混合表达为例，用户在使用中文进行表达的过程中，可以穿插使用英文词句。例如，“我买了最新款的iPhone”、“来一首Yesterday once more”。

然而，目前的语音识别技术，对于单一语言的语音识别较为准确，而在语音中包含多种语言的情况下，识别的准确率明显下降。

发明内容

本发明实施例提供一种数据处理方法、装置和用于数据处理的装置，可以提高在语音中包含多种语言的情况下，语音识别的准确率。

为了解决上述问题，本发明实施例公开了一种数据处理方法，所述方法包括：

根据多语言声学模型，确定语音信息中语音帧的语言类型；其中，所述多语言声学模型为根据至少两种语言类型的声学数据训练得到；

根据所述语音帧的语言类型对应的解码网络，对所述语音帧进行解码，以得到所述语音帧的第一解码结果；

根据所述第一解码结果，确定所述语音信息对应的识别结果。