[发明专利]一种数据处理方法、装置和用于数据处理的装置在审
申请号: | 201811603538.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN111369978A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 周盼 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/16;G10L15/22;G10L15/26 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 用于 | ||
本发明实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;根据所述第一解码结果,确定所述语音信息对应的识别结果。本发明实施例可以提高语音识别的准确率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
背景技术
语音识别技术,也被称为ASR(Automatic Speech Recognition,自动语音识别),其目标是将语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
在日常的语言表达中,可能会出现多种语言混合表达的情况。以中文和英文混合表达为例,用户在使用中文进行表达的过程中,可以穿插使用英文词句。例如,“我买了最新款的iPhone”、“来一首Yesterday once more”。
然而,目前的语音识别技术,对于单一语言的语音识别较为准确,而在语音中包含多种语言的情况下,识别的准确率明显下降。
发明内容
本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,可以提高在语音中包含多种语言的情况下,语音识别的准确率。
为了解决上述问题,本发明实施例公开了一种数据处理方法,所述方法包括:
根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;
根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;
根据所述第一解码结果,确定所述语音信息对应的识别结果。
另一方面,本发明实施例公开了一种数据处理装置,所述装置包括:
类型确定模块,用于根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;
第一解码模块,用于根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;
结果确定模块,用于根据所述第一解码结果,确定所述语音信息对应的识别结果。
再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;
根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;
根据所述第一解码结果,确定所述语音信息对应的识别结果。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的数据处理方法。
本发明实施例包括以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811603538.6/2.html,转载请声明来源钻瓜专利网。