[发明专利]一种多语言的智能语音翻译交互平台有效
申请号: | 202310558501.0 | 申请日: | 2023-05-18 |
公开(公告)号: | CN116306705B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 葛颂;盖志鹏;赵娜;刘军礼 | 申请(专利权)人: | 山东省科学院海洋仪器仪表研究所 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/42;G06F18/2321;G06F40/289;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 赵梅 |
地址: | 266200 山东省青岛市即墨区鳌山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 智能 语音 翻译 交互 平台 | ||
本发明涉及语言翻译技术领域,尤其为一种多语言的智能语音翻译交互平台,包括:语音录入模块:用于采集候选语音并转换为候选语言译文;语言选择模块:用于供用户选择目标语言;语言翻译模块:用于将候选语言译文翻译成目标语言文本;翻译优化模块:用于基于数据挖掘算法挖掘候选语言译文中的模糊译词并进行翻译优化;语音生成模块:用于生成最终的目标语言文本并转化为智能语音进行上传。本发明通过将采集的语音转化为文字进行翻译,通过数据挖掘算法获取待翻译的文段中的有多种读音或多重意思的模糊译词,并对模糊译词的最佳词义项进行筛选以实现翻译优化,并最终生成智能语音,大大提高了翻译的准确性,便于用户的理解。
技术领域
本发明涉及语言翻译技术领域,尤其是一种多语言的智能语音翻译交互平台。
背景技术
现有生活中,随着人工智能与多媒体技术的进步与发展,智能语音技术作为一种新型的信息传递方式逐渐被人们发展和利用,语音技术的优势也大大显现,现有智能语音逐渐从被动变为主动,很多服务和商业行为都可以通过语音交互技术来实现智能化操作,能够为用户提供更加全面的服务。现有技术中的语音翻译技术已经较为成熟,但是当遇到有多种读音或多重意思的文字时,会由于翻译不准确造成用户的理解困难。
发明内容
本发明的目的是通过提出一种多语言的智能语音翻译交互平台,以解决上述背景技术中提出的缺陷。
本发明采用的技术方案如下:
提供一种多语言的智能语音翻译交互平台,包括:
语音录入模块:用于采集候选语音并转换为候选语言译文;
语言选择模块:用于供用户选择目标语言;
语言翻译模块:用于将候选语言译文翻译成目标语言文本;
翻译优化模块:用于基于数据挖掘算法挖掘候选语言译文中的模糊译词并进行翻译优化;
语音生成模块:用于生成最终的目标语言文本并转化为智能语音进行上传。
作为本发明的一种优选技术方案:所述交互平台以术语库、语料库和知识库综合构成的语言知识库作为支撑层。
作为本发明的一种优选技术方案:所述语言翻译模块基于语言知识库中对提取的候选语言译文进行匹配翻译。
作为本发明的一种优选技术方案:所述语言翻译模块基于长短时记忆网络对候选语言译文中的词向量进行抽取,并基于距离翻译算法将候选语言译文翻译成目标语言译文。
作为本发明的一种优选技术方案:所述对候选语言译文中的词向量进行抽取具体如下:
设词语中的单词向量为,经过长短时记忆网络进行时序语义信息特征抽取后得到单词特征向量序列为,通过下式计算每个词语中每一个单词向量对应的权重,计算获得当前候选语言译文中的词语向量,其中,为候选语言译文,为候选语言译文中的句子:
通过下式计算句子中每一个词向量的权重:
;
;
其中,为长短时记忆网络的权重矩阵,为长短时记忆网络的偏置参数,为词语中第个单词特征向量,为转置,为注意力权重,为词语中的单词总数。
作为本发明的一种优选技术方案:所述距离翻译算法中通过词向量的欧式距离以及权值衡量词向量间的相似度:
;
其中,表示候选语言译文输入的词语特征,表示目标语言译文输入的词语映射为候选语言时对应的特征;选取其中欧式距离最短时对应的目标语言中的词语作为目标语言译文的词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省科学院海洋仪器仪表研究所,未经山东省科学院海洋仪器仪表研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310558501.0/2.html,转载请声明来源钻瓜专利网。