[发明专利]构建树结构及基于树结构的机器翻译系统的方法有效
申请号: | 201210068782.3 | 申请日: | 2012-03-15 |
公开(公告)号: | CN102662932A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 宗成庆;翟飞飞 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种构建树结构及基于相应树结构的机器翻译系统的方法,所述方法包括如下步骤:对所述双语语料中的双语句子对进行分词、词性标注和词对齐;根据所述词对齐的结果,对所述双语句子对进行双语切分,生成比双语句子对长度更短的双语子句对,并对生成的所述双语子句对重新进行词对齐;根据所述双语子句对词对齐的结果,进行子句合并以获得所述双语句子对的词对齐,并为所述双语句子对构造压缩森林;从所述压缩森林中选择适合于机器翻译的树结构。本发明无需任何句法树资源,只要有词性标注资源的语言对,就可以构建基于树结构的翻译系统。 | ||
搜索关键词: | 构建 结构 基于 机器翻译 系统 方法 | ||
【主权项】:
一种利用双语语料构建树结构的方法,所述树结构用于构建机器翻译系统,其特征在于,所述方法包括如下步骤:对所述双语语料中的双语句子对进行分词、词性标注和词对齐;根据所述词对齐的结果,对所述双语句子对进行双语切分,生成比双语句子对长度更短的双语子句对,并对生成的所述双语子句对重新进行词对齐;根据所述双语子句对词对齐的结果,进行子句合并以获得所述双语句子对的词对齐,并为所述双语句子对构造压缩森林;从所述压缩森林中选择适合于机器翻译的树结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210068782.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车倒车辅助系统
- 下一篇:用于运行混合动力的驱动系统的方法和装置