[发明专利]计算机翻译数据处理方法及装置在审
申请号: | 201210285384.7 | 申请日: | 2012-08-10 |
公开(公告)号: | CN103577397A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 吴克文;廖剑;张永刚;林锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机 翻译 数据处理 方法 装置 | ||
1.一种计算机翻译数据处理方法,其特征在于,包括以下步骤:
接收待翻译的源语句,对所述源语句进行切分;
将切分得到的词语在分类词典中进行查询,确定各词语的类别;
根据所述源语句各词语的类别在语义模式数据库中查找确定所述源语句的语义模式;
查找所述语义模式对应的翻译规则,根据所述翻译规则对源语句进行翻译。
2.如权利要求1所述的计算机翻译数据处理方法,其特征在于,所述根据所述源语句各词语的类别在语义模式数据库中查找确定所述源语句的语义模式包括:
确定源语句的类别组合;
将得到的类别组合分别代入语义模式数据库中查找匹配的语义模式,若能够找到,则获取所述语义模式;
比较所述各匹配的语义模式所对应的类别组合中的类别数量,选取类别数量最多的类别组合所对应的语义模式为源语句的语义模式。
3.如权利要求2所述的计算机翻译数据处理方法,其特征在于,所述选取类别数量最多的类别组合所对应的语义模式为源语句的语义模式包括:
判断所述类别数量最多的类别组合是否为源语句的全部词语类别,若是,则选取所述类别数量最多的类别组合所对应的语义模式为源语句的语义模式;
若否,则判断源语句剩余的词语类别组合是否有对应的语义模式,若是,则获取其语义模式,并与所述类别数量最多的类别组合所对应的语义模式共同作为源语句的语义模式,若否,则将所述类别数量最多的类别组合所对应的语义模式作为源语句的语义模式。
4.如权利要求2或3所述的计算机翻译数据处理方法,其特征在于,所述确定源语句的类别组合包括:
若类别数量N为2,则类别组合为一个;
若类别数量N>2,则类别组合一共有N-1个,包括从第一个类别开始的前两个类别为第一类别组合;从第一个类别开始的前三个类别为第二类别组合,直到从第一个类别开始的N个类别为第N-1类别组合。
5.如权利要求1所述的计算机翻译数据处理方法,其特征在于,若源语句的语义模式为至少两个语义模式的组合,所述根据所述翻译规则对源语句进行翻译包括:
按照各语义模式所对应的翻译规则对源语句中对应部分进行翻译得到部分翻译结果,将所述部分翻译结果组合得到源语句的最终翻译结果;或
按照各语义模式所对应的翻译规则对源语句中对应部分进行翻译得到部分翻译结果,获取各语义模式间的翻译规则,根据所述翻译规则对部分翻译结果进行调整,得到源语句的最终翻译结果。
6.一种计算机翻译数据处理装置,其特征在于,包括:
数据获取模块,用于接收待翻译的源语句,对所述源语句进行切分;
类别确定模块,用于将切分得到的词语在分类词典中进行查询,确定各词语的类别;
语义模式确定模块,用于根据所述源语句各词语的类别在语义模式数据库中查找确定所述源语句的语义模式;
翻译模块,用于查找所述语义模式对应的翻译规则,根据所述翻译规则对源语句进行翻译。
7.如权利要求6所述的计算机翻译数据处理装置,其特征在于,所述语义模式确定模块包括:
类别组合确定单元,用于确定源语句的类别组合;
语义模式匹配单元,用于将得到的类别组合分别代入语义模式数据库中查找匹配的语义模式,若能够找到,则获取所述语义模式;
比较选取单元,用于比较所述各匹配的语义模式所对应的类别组合中的类别数量,选取类别数量最多的类别组合所对应的语义模式为源语句的语义模式。
8.如权利要求7所述的计算机翻译数据处理装置,其特征在于,所述比较选取单元包括:
判断子单元,用于判断所述类别数量最多的类别组合是否为源语句的全部词语类别,若是,则选取所述类别数量最多的类别组合所对应的语义模式为源语句的语义模式;
若否,则判断源语句剩余的词语类别组合是否有对应的语义模式,若是,则获取其语义模式,并与所述类别数量最多的类别组合所对应的语义模式共同作为源语句的语义模式,若否,则将所述类别数量最多的类别组合所对应的语义模式作为源语句的语义模式。
9.如权利要求6所述的计算机翻译数据处理装置,其特征在于,若源语句的语义模式为至少两个语义模式的组合,所述翻译模块包括:
翻译单元,用于按照各语义模式所对应的翻译规则对源语句中对应部分进行翻译得到部分翻译结果;
组合单元,用于将所述部分翻译结果组合得到源语句的最终翻译结果;或根据语义模式间的翻译规则对所述部分翻译结果进行调整,得到源语句的最终翻译结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210285384.7/1.html,转载请声明来源钻瓜专利网。