[发明专利]一种方言翻译方法及装置有效
申请号: | 201910262128.8 | 申请日: | 2019-04-02 |
公开(公告)号: | CN109979432B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 许丽;潘嘉 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G06F40/58 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方言 翻译 方法 装置 | ||
1.一种方言翻译方法,其特征在于,包括:
获取待翻译的目标语音;
生成所述目标语音的语音特征,所述语音特征中包含了所述目标语音的方言特征;
根据所述目标语音的语音特征、以及预置的各种方言的方言表征向量,利用预先构建的方言语音翻译模型,对所述目标语音进行翻译;其中,所述方言语音翻译模型,以属于各种方言类型的语音数据作为训练样本、以每一语音数据的翻译结果作为样本标签,训练得到。
2.根据权利要求1所述的方法,其特征在于,所述方言特征包括以下一项或多项:
所述目标语音的方言表征向量;
所述目标语音的方言表征向量与所述各种方言的方言表征向量之间的相似度;
所述目标语音经各个不同方言语音识别模型进行识别得到的识别结果的置信度;
所述目标语音所属用户的用户位置信息;
所述目标语音的语音基频特征。
3.根据权利要求1所述的方法,其特征在于,所述生成所述目标语音的语音特征之前,还包括:
判断所述方言语音翻译模型是否支持对所述目标语音的翻译;
若所述方言语音翻译模型支持对所述目标语音的翻译,则执行所述生成所述目标语音的语音特征的步骤。
4.根据权利要求3所述的方法,其特征在于,所述判断所述方言语音翻译模型是否支持对所述目标语音的翻译,包括:
根据所述目标语音的方言表征向量、以及所述各种方言的方言表征向量,判断所述方言语音翻译模型是否支持对所述目标语音的翻译。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标语音的方言表征向量、以及所述各种方言的方言表征向量,判断所述方言语音翻译模型是否支持对所述目标语音的翻译,包括:
判断所述目标语音的方言表征向量是否满足第一条件和/或第二条件;
若是,则判定所述方言语音翻译模型支持对所述目标语音的翻译;
若否,则判定所述方言语音翻译模型不支持对所述目标语音的翻译;
其中,所述第一条件为最大相似度大于第一阈值,所述最大相似度为所述目标语音的方言表征向量与所述各种方言的方言表征向量之间的各个相似度中的最大值;所述第二条件为所述各个相似度的均值不小于第二阈值以及所述各个相似度的方差不小于第三阈值。
6.根据权利要求1所述的方法,其特征在于,所述方言语音翻译模型包括编码层、注意力层和解码层;
则,所述利用预先构建的方言语音翻译模型,对所述目标语音进行翻译,包括:
利用所述编码层对所述目标语音的语音特征进行编码,得到语音编码结果;
利用所述注意力层对所述语音编码结果和所述各种方言的方言表征向量进行关注,得到中间处理结果;
利用所述解码层对所述中间处理结果进行解码,得到所述目标语音的翻译结果。
7.一种方言翻译装置,其特征在于,包括:
目标语音获取单元,用于获取待翻译的目标语音;
语音特征生成单元,用于生成所述目标语音的语音特征,所述语音特征中包含了所述目标语音的方言特征;
目标语音翻译单元,用于根据所述目标语音的语音特征、以及预置的各种方言的方言表征向量,利用预先构建的方言语音翻译模型,对所述目标语音进行翻译;其中,所述方言语音翻译模型,以属于各种方言类型的语音数据作为训练样本、以每一语音数据的翻译结果作为样本标签,训练得到。
8.根据权利要求7所述的装置,其特征在于,所述方言特征包括以下一项或多项:
所述目标语音的方言表征向量;
所述目标语音的方言表征向量与所述各种方言的方言表征向量之间的相似度;
所述目标语音经各个不同方言语音识别模型进行识别得到的识别结果的置信度;
所述目标语音所属用户的用户位置信息;
所述目标语音的语音基频特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910262128.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能智能语言翻译系统
- 下一篇:语音跟读处理方法、装置、设备和存储介质