[发明专利]一种基于特征性句干提取的机器翻译方法及装置有效
申请号: | 201810544842.1 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108763229B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 李晶洁;胡文杰 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 上海统摄知识产权代理事务所(普通合伙) 31303 | 代理人: | 金利琴 |
地址: | 201620 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于特征性句干提取的机器翻译方法及装置,具体为:1)在语言A语料库中获取多词序列并识别结构满足句干要求的序列;2)基于内部粘着力、外部边界独立性及篇章分布域确定特征性句干并基于MIN‑MAX归一化算法和局部最大值消重法对其筛选;3)翻译特征性句干得特征性句干数据库;4)输入待翻译的语言A文本,逐句提取句干,在特征性句干数据库中查找句干译文,翻译句干外的词语并将其译文按照目标语言B的语序组合到句干译文中得到译文。装置包括特征性句干数据库单元、语言输入单元、句干提取单元、句干识别单元、翻译单元及组合单元。本发明的机器翻译方法及装置,翻译效率高,处理时间短,极具应用前景。 | ||
搜索关键词: | 一种 基于 特征 性句干 提取 机器翻译 方法 装置 | ||
【主权项】:
1.一种基于特征性句干提取的机器翻译方法,其特征是:首先输入待翻译的语言A文本,再逐句提取语言A文本的句干,然后在特征性句干数据库中查找句干译文,同时翻译句干外的词语,最后将句干外的词语的译文按照目标语言B的语序组合到句干译文中得到译文;所述特征性句干数据库的建立步骤如下:(1)在语言A语料库中获取多词序列;(2)在多词序列中识别结构满足句干要求的序列;(3)基于内部粘着力、外部边界独立性及篇章分布域在结构满足句干要求的序列中确定特征性句干;(4)基于MIN‑MAX归一化算法和局部最大值消重法对特征性句干进行筛选;(5)将筛选所得的特征性句干译为目标语言B,记录各特征性句干与其译文即得特征性句干数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810544842.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种自然语言辅助处理系统
- 下一篇:利用外部信息的神经机器翻译方法