[发明专利]一种多语言的智能语音翻译交互平台有效
申请号: | 202310558501.0 | 申请日: | 2023-05-18 |
公开(公告)号: | CN116306705B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 葛颂;盖志鹏;赵娜;刘军礼 | 申请(专利权)人: | 山东省科学院海洋仪器仪表研究所 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/42;G06F18/2321;G06F40/289;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 赵梅 |
地址: | 266200 山东省青岛市即墨区鳌山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 智能 语音 翻译 交互 平台 | ||
1.一种多语言的智能语音翻译交互平台,其特征在于:包括:
语音录入模块(100):用于采集候选语音并转换为候选语言译文;
语言选择模块(200):用于供用户选择目标语言;
语言翻译模块(300):用于将候选语言译文翻译成目标语言文本;
翻译优化模块(400):用于基于数据挖掘算法挖掘候选语言译文中的模糊译词并进行翻译优化;
语音生成模块(500):用于生成最终的目标语言文本并转化为智能语音进行上传;
所述翻译优化模块(400)的数据挖掘算法步骤如下:
设挖掘集为,数据集维度为,数据挖掘子空间为,数据属性集合包含子空间,并且子空间中的对象为,基于数据离群特征,获取子空间中数据对象的邻域,该邻域为非均匀分布状态,得到子空间离群概率距离为:
;
其中,为子空间的离群概率距离,为距离,为离群概率;
通过理算数据标准距离与密度的比值表示离散数据特征:
;
采用信息熵检测方法,在数据挖掘子空间中,对数据的分布特征进行分析,基于概率函数获得数据信息熵:
;
根据信息熵计算结果,对待测数据进行排序,并按照从大到小的排序方式,提取排序前10%个的信息熵数据作为聚类中心对剩余数据进行检测;
按照下式计算数据聚类中心距离:
;
其中,、为随机提取的聚类中心,并将其作为核心,对所有数据信息熵进行计算后获得聚类阈值,若聚类中心距离小于阈值时,则需要重新选择聚类中心,并重复计算数据聚类中心距离直至聚类距离计算结果大于阈值;
所述模糊译词重新进行筛选翻译具体如下:
筛选个候选语言译文中的意译模糊译词集合,其中为候选语言意译模糊译词,筛选个目标语言译文中的意译模糊译词集合,其中为目标语言意译模糊译词;意译特征函数如下:
;
其中,、、、均表示双向词汇意译翻译概率,
候选语言译文中的音译模糊译词由n个单词组成,翻译成音译集合表示为,多语言翻译模块翻译的目标语言译文中的音译模糊译词由m个单词组成,音译集合表示为,音译特征函数表示如下:
;
通过如下的置信度函数计算模糊译词的置信度,并通过对齐函数比较模糊译词的置信度,并以此筛选模糊译词的最佳词义项:
;
;
其中,和分别为意译特征函数和音译特征函数对应的权重。
2.根据权利要求1所述的多语言的智能语音翻译交互平台,其特征在于:所述交互平台以术语库、语料库和知识库综合构成的语言知识库作为支撑层。
3.根据权利要求1所述的多语言的智能语音翻译交互平台,其特征在于:所述语言翻译模块(300)基于语言知识库中对提取的候选语言译文进行匹配翻译。
4.根据权利要求3所述的多语言的智能语音翻译交互平台,其特征在于:所述语言翻译模块(300)基于长短时记忆网络对候选语言译文中的词向量进行抽取,并基于距离翻译算法将候选语言译文翻译成目标语言译文。
5.根据权利要求4所述的多语言的智能语音翻译交互平台,其特征在于:所述对候选语言译文中的词向量进行抽取具体如下:
设词语中的单词向量为,经过长短时记忆网络进行时序语义信息特征抽取后得到单词特征向量序列为,通过下式计算每个词语中每一个单词向量对应的权重,计算获得当前候选语言译文中的词语向量,其中,为候选语言译文,为候选语言译文中的句子:
通过下式计算句子中每一个词向量的权重:
;
;
其中,为长短时记忆网络的权重矩阵,为长短时记忆网络的偏置参数,为词语中第个单词特征向量,为转置,为注意力权重,为词语中的单词总数。
6.根据权利要求5所述的多语言的智能语音翻译交互平台,其特征在于:所述距离翻译算法中通过词向量的欧式距离以及权值衡量词向量间的相似度:
;
其中,表示候选语言译文输入的词语特征,表示目标语言译文输入的词语映射为候选语言时对应的特征;选取其中欧式距离最短时对应的目标语言中的词语作为目标语言译文的词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省科学院海洋仪器仪表研究所,未经山东省科学院海洋仪器仪表研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310558501.0/1.html,转载请声明来源钻瓜专利网。