[发明专利]数据处理装置、数据处理方法以及电子设备有效
申请号: | 201310138955.9 | 申请日: | 2013-04-19 |
公开(公告)号: | CN104111917B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 张姝;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,陈炜 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了数据处理装置、数据处理方法以及电子设备,以克服现有的语言数据处理技术所存在的处理精度不高的问题。上述数据处理装置包括语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;匹配单元,用于基于预定双语语料库获得上述源语言语义角色序列分别与每个上述目标语言语义角色序列之间的匹配分数;以及调序结果确定单元,用于将匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果。本发明的上述技术能够应用于数据处理领域。 | ||
搜索关键词: | 数据处理 装置 方法 以及 电子设备 | ||
【主权项】:
一种数据处理装置,包括:语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;匹配单元,用于基于预定双语语料库获得所述源语言语义角色序列分别与每个所述目标语言语义角色序列之间的匹配分数,其中,所述预定双语语料库包括多个经过语义角色标注的、针对源语言和目标语言的双语句对;以及调序结果确定单元,用于将所述匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果,其中,所述匹配单元包括:相关程度获得子单元,用于针对每个所述目标语言语义角色序列中的每个目标语言谓词,利用所述预定双语语料库,获得该目标语言语义角色序列的包含该目标语言谓词的至少部分子序列与所述源语言语义角色序列之间的相关程度;以及匹配分数确定子单元,用于针对每个所述目标语言语义角色序列,基于获得的与该目标语言语义角色序列有关的所述相关程度来确定该目标语言语义角色序列与所述源语言语义角色序列之间的匹配分数,并且其中,所述匹配分数确定子单元用于根据下式获得所述匹配分数:score(S,T)=P(VT|S)*P(a1|VT,S)*Π2hP(ai|ai-1,VT,S)*P(b1|VT,S)*Π2kP(bj|VT,bj-1,S),]]>其中,S为所述源语言语义角色序列,T为所述目标语言语义角色序列,VT为T中的目标语言谓词,ai为T中位于VT左侧的第i个语义角色,h为VT左侧的语义角色数量,bj为T中位于VT右侧的第j个语义角色,k为VT右侧的语义角色数量,P(VT|S)为用于表示S与T的子序列{VT}之间的相关程度的条件概率,P(a1|VT,S)为用于表示S与T的子序列{VT}和{a1,VT}之间的相关程度的条件概率,P(ai|ai‑1,VT,S)为用于表示S与T的子序列{ai‑1,VT}和{ai,ai‑1,VT}之间的相关程度的条件概率,P(b1|VT,S)为用于表示S与T的子序列{VT}和{VT,b1}之间的相关程度的条件概率,以及P(bj|VT,bj‑1,S)为用于表示S与T的子序列{VT,bj‑1}和{VT,bj‑1,bj}之间的相关程度的条件概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310138955.9/,转载请声明来源钻瓜专利网。