[发明专利]数据处理装置、数据处理方法以及电子设备有效
申请号: | 201310138955.9 | 申请日: | 2013-04-19 |
公开(公告)号: | CN104111917B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 张姝;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,陈炜 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 装置 方法 以及 电子设备 | ||
1.一种数据处理装置,包括:
语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;
匹配单元,用于基于预定双语语料库获得所述源语言语义角色序列分别与每个所述目标语言语义角色序列之间的匹配分数,其中,所述预定双语语料库包括多个经过语义角色标注的、针对源语言和目标语言的双语句对;以及
调序结果确定单元,用于将所述匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果。
2.根据权利要求1所述的数据处理装置,其中,所述匹配单元包括:
相关程度获得子单元,用于针对每个所述目标语言语义角色序列中的每个目标语言谓词,利用所述预定双语语料库,获得该目标语言语义角色序列的包含该目标语言谓词的至少部分子序列与所述源语言语义角色序列之间的相关程度;以及
匹配分数确定子单元,用于针对每个所述目标语言语义角色序列,基于获得的与该目标语言语义角色序列有关的所述相关程度来确定该目标语言语义角色序列与所述源语言语义角色序列之间的匹配分数。
3.根据权利要求2所述的数据处理装置,其中,所述相关程度获得子单元用于针对每个所述目标语言语义角色序列中的每个目标语言谓词,获得如下多种相关程度中的任一种或多种:
该目标语言语义角色序列的仅包括该目标语言谓词的子序列与所述源语言语义角色序列之间的相关程度;
该目标语言语义角色序列的包括位于该目标语言谓词左侧的至少一个语义角色的子序列与所述源语言语义角色序列之间的相关程度;
该目标语言语义角色序列的包括该目标语言谓词和位于该目标语言谓词左侧的至少一个语义角色的子序列与所述源语言语义角色序列之间的相关程度;以及
该目标语言语义角色序列的仅包括该目标语言谓词的子序列、包括位于该目标语言谓词左侧的至少一个语义角色的子序列、以及包括该目标语言谓词和位于该目标语言谓词左侧的至少一个语义角色的子序列中的至少两种子序列与所述源语言语义角色序列之间的相关程度。
4.根据权利要求2或3所述的数据处理装置,其中,所述匹配分数确定子单元用于根据下式获得所述匹配分数:
score(S,T)=P(VT|S)*P(a1|VT,S)
其中,S为所述源语言语义角色序列,T为所述目标语言语义角色序列,VT为T中的目标语言谓词,ai为T中位于VT左侧的第i个语义角色,h为VT左侧的语义角色数量,bj为T中位于VT右侧的第j个语义角色,k为VT右侧的语义角色数量,P(VT|S)为用于表示S与T的子序列{VT}之间的相关程度的条件概率,P(a1|VT,S)为用于表示S与T的子序列{VT}和{a1,VT}之间的相关程度的条件概率,P(ai|ai-1,VT,S)为用于表示S与T的子序列{ai-1,VT}和{ai,ai-1,VT}之间的相关程度的条件概率,P(b1|VT,S)为用于表示S与T的子序列{VT}和{VT,b1}之间的相关程度的条件概率,以及P(bj|VT,bj-1,S)为用于表示S与T的子序列{VT,bj-1}和{VT,bj-1,bj}之间的相关程度的条件概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310138955.9/1.html,转载请声明来源钻瓜专利网。