[发明专利]一种基于特征性句干提取的机器翻译方法及装置有效

专利信息
申请号: 201810544842.1 申请日: 2018-05-31
公开(公告)号: CN108763229B 公开(公告)日: 2020-06-12
发明(设计)人: 李晶洁;胡文杰 申请(专利权)人: 东华大学
主分类号: G06F40/58 分类号: G06F40/58
代理公司: 上海统摄知识产权代理事务所(普通合伙) 31303 代理人: 金利琴
地址: 201620 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于特征性句干提取的机器翻译方法及装置,具体为:1)在语言A语料库中获取多词序列并识别结构满足句干要求的序列;2)基于内部粘着力、外部边界独立性及篇章分布域确定特征性句干并基于MIN‑MAX归一化算法和局部最大值消重法对其筛选;3)翻译特征性句干得特征性句干数据库;4)输入待翻译的语言A文本,逐句提取句干,在特征性句干数据库中查找句干译文,翻译句干外的词语并将其译文按照目标语言B的语序组合到句干译文中得到译文。装置包括特征性句干数据库单元、语言输入单元、句干提取单元、句干识别单元、翻译单元及组合单元。本发明的机器翻译方法及装置,翻译效率高,处理时间短,极具应用前景。
搜索关键词: 一种 基于 特征 性句干 提取 机器翻译 方法 装置
【主权项】:
1.一种基于特征性句干提取的机器翻译方法,其特征是:首先输入待翻译的语言A文本,再逐句提取语言A文本的句干,然后在特征性句干数据库中查找句干译文,同时翻译句干外的词语,最后将句干外的词语的译文按照目标语言B的语序组合到句干译文中得到译文;所述特征性句干数据库的建立步骤如下:(1)在语言A语料库中获取多词序列;(2)在多词序列中识别结构满足句干要求的序列;(3)基于内部粘着力、外部边界独立性及篇章分布域在结构满足句干要求的序列中确定特征性句干;(4)基于MIN‑MAX归一化算法和局部最大值消重法对特征性句干进行筛选;(5)将筛选所得的特征性句干译为目标语言B,记录各特征性句干与其译文即得特征性句干数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810544842.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top