[发明专利]来源于单语和可用双语语料库的搭配翻译有效
申请号: | 200680020698.7 | 申请日: | 2006-06-14 |
公开(公告)号: | CN101194253A | 公开(公告)日: | 2008-06-04 |
发明(设计)人: | Y·鲁;J·高;M·周;J·T·陈;M·李 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了用于提取搭配翻译的方法和系统。该方法包括使用单语源和目标语言语料库以及可用的双语语料库来构造一个搭配翻译模型。搭配翻译模型采用关于围绕搭配的上下文词语的期望最大化算法。该搭配翻译模型稍后可用于提取一个搭配翻译字典。基于上下文冗余和/或双向翻译约束的可任选过滤器可用于确保该字典中仅包含高度可靠的搭配翻译。所构造的搭配翻译模型和所提取的搭配翻译字典可稍后用于进一步的自然语言处理,诸如句子翻译。 | ||
搜索关键词: | 来源于 可用 双语 语料库 搭配 翻译 | ||
【主权项】:
1.一种包括可由计算机读取的指令的计算机可读介质,当所述指令被执行时,使所述计算机构造一个搭配翻译模型,包括以下步骤:从单语源语料库中提取源语言搭配;从单语目标语料库中提取目标语言搭配;使用至少所述源和目标语言搭配来构造搭配翻译模型,其中所述搭配语言模型是基于一组特征函数的,其中所述特征函数之一包括围绕所提取的源语言搭配的上下文词语的概率信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200680020698.7/,转载请声明来源钻瓜专利网。