[发明专利]一种双语平行语料的句对齐方法有效
申请号: | 201710433746.5 | 申请日: | 2017-06-09 |
公开(公告)号: | CN107391495B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 刘强;彭蓉 | 申请(专利权)人: | 北京同文世纪科技有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51;G06F40/58 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;曲芳兵 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种双语平行语料的句对齐方法,包括:A、获取包含有源语言与目标语言的单词互译对及单词互译概率的双语概率分布词典;B、根据待对齐文本的源语言与目标语言的句子数量,构建动态规划矩阵;根据所述动态规划矩阵、所述双语概率分布词典确定基于句长信息、单词信息、单词互译概率的不同对齐模式下的评价分数;C、根据所述评价分数,确定评价分数大于指定阈值的对齐模式下的对齐路径;D、根据所述对齐路径确定待对齐文本的源语言和目标语言句子的对齐路径序列。由上,本申请提供的一种双语平行语料的句对齐方法,有利于提高双语平行语料自动句对齐的精度。 | ||
搜索关键词: | 一种 双语 平行 语料 对齐 方法 | ||
【主权项】:
一种双语平行语料的句对齐方法,其特征在于,包括步骤:A、获取包含有源语言与目标语言的单词互译对及单词互译概率的双语概率分布词典;B、根据待对齐文本的源语言与目标语言的句子数量,构建动态规划矩阵;根据所述动态规划矩阵、所述双语概率分布词典确定基于句长信息、单词信息、单词互译概率的不同对齐模式下的评价分数;C、根据所述评价分数,确定评价分数大于指定阈值的对齐模式下的对齐路径;D、根据所述对齐路径确定待对齐文本的源语言和目标语言句子的对齐路径序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京同文世纪科技有限公司,未经北京同文世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710433746.5/,转载请声明来源钻瓜专利网。
- 上一篇:翻译辅助系统
- 下一篇:时间间隔的数据查询方法、装置及索引构建方法、装置