[发明专利]即时通话语音的翻译方法、装置以及终端在审
申请号: | 201811289946.9 | 申请日: | 2018-10-31 |
公开(公告)号: | CN111199160A | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 张乐杰;李玉峰 | 申请(专利权)人: | 西安欧思奇软件有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G10L15/22;G10L15/16 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 710065 陕西省西安市高新区*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 即时 通话 语音 翻译 方法 装置 以及 终端 | ||
1.一种即时通话语音的翻译方法,其特征在于,包括如下步骤:
获取待翻译的即时通话语音信号,并将所述待翻译的即时语音信号切分为预设个数的语音帧;
确定各个语音帧分别对应的特征向量;
基于神经网络的语音识别模型对各个语音帧分别对应的特征向量进行语音识别,以确定相应的语音识别结果;
将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息;
输出所述翻译信息。
2.根据权利要求1所述的方法,其特征在于,基于神经网络的语音识别模型对各个语音帧分别对应的特征向量进行语音识别,以确定相应的语音识别结果,包括:
利用基于神经网络的语音识别模型对所述特征向量进行识别,确定与所述各个特征向量分别对应的状态值;
对所述各个特征向量分别对应的状态值进行解码,得到所述即时通话语音信号对应的文本信息。
3.根据权利要求2所述的方法,其特征在于,所述利用基于神经网络的语音识别模型对所述特征向量进行识别之前,所述方法还包括:
获取即时通话语音信号中的一个语音片段;
确定所述语音片段对应的语种;
所述利用基于神经网络的语音识别模型对所述特征向量进行识别,确定与所述各个特征向量分别对应的状态值,包括:
利用与确定的语种对应的语音识别模型对所述特征向量进行识别,确定与所述各个特征向量分别对应的状态值。
4.根据权利要求1所述的方法,其特征在于,所述将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息,包括:
对所述语音识别结果进行处理,以确定所述语音识别结果对应的文本向量;
利用基于注意力机制的翻译模型对所述文本向量进行处理,得到与预设的目标语种匹配的文本信息。
5.根据权利要求1所述的方法,其特征在于,所述将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息,包括:
对所述语音识别结果进行处理,以确定所述语音识别结果对应的文本向量;
利用基于注意力机制的翻译模型对所述文本向量进行处理,得到与预设的目标语种匹配的文本信息;
将所述文本信息合成与预设的目标语种匹配的语音信息。
6.根据权利要求4或5所述的方法,其特征在于,利用基于注意力机制的翻译模型对所述文本向量进行处理,得到与预设的目标语种匹配的文本信息,包括:
基于所述文本向量,确定待翻译的即时通信语音信号中是否包含预设类型的文本信息;
若包含预设类型的文本信息,则基于特定的语言词典将所述预设类型的文本信息转换为源文本信息,并对所述源文本信息进行处理,得到所述源文本信息对应的源文本向量,并将所述源文本向量与非源文本向量,进行合成,得到合成后的文本向量,所述非源文本向量为所述文本向量中不包含所述预设类型的文本信息对应的文本向量;
利用基于注意力机制的翻译模型对所述合成后的文本向量进行处理,得到与预设的目标语种匹配的文本信息。
7.根据权利要求6所述的方法,其特征在于,所述预设类型的文本信息包括以下至少一种:成语、俚语、歇后语、网络流行语、古诗词以及文言文。
8.一种即时通话语音的翻译装置,其特征在于,包括如下步骤:
第一获取模块,用于获取待翻译的即时通话语音信号;
切分模块,用于将所述第一获取模块获取到的待翻译的即时语音信号切分为预设个数的语音帧;
第一确定模块,用于确定所述切分模块切换后的各个语音帧分别对应的特征向量;
语音识别模块,用于基于神经网络的语音识别模型对所述第一确定模块确定出的各个语音帧分别对应的特征向量进行语音识别,以确定相应的语音识别结果;
翻译模块,用于将所述语音识别模块语音识别出的语音识别结果翻译为与预设的目标语种匹配的翻译信息;
输出模块,用于输出所述翻译信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安欧思奇软件有限公司,未经西安欧思奇软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811289946.9/1.html,转载请声明来源钻瓜专利网。