[发明专利]基于多词单元进行辅助翻译的方法和装置在审
申请号: | 201410164469.9 | 申请日: | 2014-04-22 |
公开(公告)号: | CN105095191A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 付亦雯;郑仲光;方瑞玉;孟遥;孙俊;宋昕 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单元 进行 辅助 翻译 方法 装置 | ||
1.一种基于多词单元进行辅助翻译的方法,包括:
获取用户输入的源语言音节或目标语言音节;
获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;
将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;
利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;以及
根据所述多词单元的权值显示目标语言的多词单元。
2.根据权利要求1所述的方法,其中,计算所述多词单元的权值包括:
根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多个短语组合之间的共现度值作为所述模型的第一特征值;以及
利用所述模型,根据所述第一特征值计算所述多词单元的权值。
3.根据权利要求1所述的方法,其中,计算所述多词单元的权值包括:
根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多个短语组合之间的共现度值作为所述模型的第一特征值;
根据所述多词单元的各短语在预设语料库中出现的频率,计算所述模型的第二特征值,所述第二特征值至少包括以下中的一个:多词单元的各短语在所述语料库中出现频率的最大值、最小值、中间值和平均值;以及
利用所述模型,根据所述第一特征值和所述第二特征值计算所述多词单元的权值。
4.根据权利要求2或3所述的方法,其中,从划分后的所述多词单元中提取出多个短语组合包括:
以多词单元划分的第一个短语作为第一短语组合,以所述第一短语组合为起始、按照所述多词单元的短语划分顺序,依次增加所述短语,每增加一个短语后生成一个短语组合,以此得到所述多词单元的多个短语组合。
5.根据权利要求4所述的方法,其中,计算所述多个短语组合之间的共现度值包括:
计算各短语组合在所述待翻译源语言文本中出现的频率值;
将所述多个短语组合按其生成顺序进行排序以构成短语组合序列,以所述短语组合序列的第二个短语组合为起始、依序计算每个短语组合与其前一个短语组合的所述频率值的比值;以及
将计算得出的多个所述比值的平均值作为所述多个短语组合之间的共现度值。
6.根据权利要求1所述的方法,在获取用户输入的源语言音节或目标语言音节之前还包括:
获取所述待翻译源语言文本中的多词单元;
根据预设的机器翻译,将所述多词单元翻译为目标语言的多词单元;以及
针对每个所述多词单元建立源语言音节与目标语言音节的关联关系。
7.根据权利要求1所述的方法,在利用预先建立的模型计算所述多词单元的权值之前还包括:
获取预设语料库中的多词单元;
将每个所述多词单元划分为多个短语,并分别从每个划分后的多词单元中提取多个短语组合;以及
计算每个所述多词单元的各短语及短语组合在所述预设语料库中出现的频率,根据所述频率值计算所述模型的特征值并对所述模型进行训练直到模型收敛。
8.根据权利要求1所述的方法,还包括:
在用户进行输入时检测用户是否进行了语种切换操作,以确认用户当前输入的音节的语种。
9.根据权利要求1所述的方法,其中,根据所述多词单元的权值显示目标语言的所述多词单元包括:
显示权值最大的所述多词单元,或按照权值的大小依序显示所述多词单元。
10.一种基于多词单元进行辅助翻译的装置,包括:
用户输入获取部件,配置为获取用户输入的源语言音节或目标语言音节;
多词单元获取部件,配置为获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;
短语提取部件,配置为将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;
权值计算部件,配置为利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;以及
输出显示部件,配置为根据所述多词单元的权值显示目标语言的所述多词单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410164469.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种访问数据实体的方法及装置
- 下一篇:一种作者分析方法和作者分析系统