[发明专利]一种方言语境的多语言翻译方法在审

申请号：	201710368832.2	申请日：	2017-05-23
公开（公告）号：	CN107248409A	公开（公告）日：	2017-10-13
发明（设计）人：	李伊甸;戴沛景	申请（专利权）人：	四川欣意迈科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/04;G10L15/06;G06F17/28
代理公司：	成都弘毅天承知识产权代理有限公司51230	代理人：	徐金琼,刘东
地址：	610000 四川省成都***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种方言语境语言翻译方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

一种方言语境的多语言翻译系统及方法，用于方言和个性化语音的翻译，属于计算机语言翻译技术领域。

背景技术

在世界各国文化、经济、军事等各领域的交往中，语言的沟通显得尤为重要，为了准确的表达两种语言的意义长期以来在各种外事交往中主要还是以人翻译为主。近年来随着计算机及数字技术的快速发展，用计算机及数字技术做翻译工作已取得了很大的进步，各种优秀的计算机翻译系统不断涌现，特别在文字翻译方面已较完美。但在用计算机翻译系统做同声翻译方面由于各母语系下方言较多语境不同或个人发音的偏好导致误译率较高，不能准确表达源语音的意义。

在众多的语言翻译系统及翻译设备中都只能将源母语系中的相对标准的基语音翻译为目标语系的标准基语音。但在现实应用环境中由于需翻译的源语音在很多情况下为非标准语音，世界上各大母语系中每种母语系都有若干的地方方言，这导致计算机化的语言翻译系统因语境的不同有很高的误译率。

专利号为200820234990.5的专利，是通过提取方言语音的字、词句作为特征与标准基语音进行直接对比来找到方言语音对应的标准基语音，一旦说方言的人发音不准确，就容易造成翻译不准确，从而找不到对应的标准基语音，而且所要翻译的每句方言都需要存储，造成存储成本、运行硬件成本高及计算机运算速度慢等问题。

发明内容

本发明的目的在于：解决现有技术中的语言翻译工具不能准确的翻译方言，增加翻译的误译率的问题，提供了一种方言语境的多语言翻译方法。

本发明采用的技术方案如下：

一种方言语境的多语言翻译方法，其特征在于包括以下步骤：

步骤1、建立母语系下各种方言语音的特征码组成的特征码库；

步骤2、根据特征码与标准基语音特征码的差异产生方言的特征补偿码，组成特征补偿码库；

步骤3、用特征补偿码与其对应的源语音复合产生出对应母语系下的标准基语音；

步骤4、标准基语音转换成目标语言的语音或文本。

进一步，特征码库的建立方法包括以下步骤：

步骤1.1、获得母语系下各种方言语音样本；

步骤1.2、对方言语音样本进行预处理去掉冗余部分，通过带通滤波器进行预滤波处理后再通过一个高通滤波器进行预加重，对预加重后的方言语音样本减噪后乘以汉明窗后进行端点检测；

步骤1.3、将乘以汉明窗预处理后的方言语音样本进行频谱分析，然后进行特征提取,特征提取频谱分析后的方言语音样本的共振峰，基音周期特征，MFCC及LPCC参数特征码；