[发明专利]一种确定双语语句对互译关系方法及系统有效
申请号: | 201611207663.6 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106598959B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 武英波 | 申请(专利权)人: | 北京金山办公软件股份有限公司;珠海金山办公软件有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/58 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种确定双语语句对互译关系方法及系统,包括确定双语语句对的匹配特征值的步骤,再根据预先建立的训练分类模型,利用匹配特征值在互译关系中的权重对双语语句进行过滤分类,确定出该双语语句对是否为符合互译关系要求的双语语句对。这样本发明实施例所述确定双语语句对互译关系方法能够快速方便的处理数据量庞大的双语语料库。本发明利用训练分类模型的分类的思想将确定双语语句对互译关系问题转换为二元分类问题,使得双语语料库匹配特征的权值能够更加科学合理的确定,比现有经验的方法更具普适性,准确率和召回率也得到相应的提高。 | ||
搜索关键词: | 一种 确定 双语 语句 关系 方法 系统 | ||
【主权项】:
一种确定双语语句对互译关系的方法,其特征在于,包括以下步骤:获取双语语料库中的目标双语语句对,其中,所述目标双语语句对为第一语言的第一句子与第二语言的第二句子所组成的语句对,所述第一句子和第二句子之间具有待确定的互译关系;对所述目标双语语句对中的第一语句和第二语句进行分析,并利用分析结果对所述第一语句和第二语句的匹配关系进行计算,得到所述目标双语语句对的匹配特征值;利用分类模型,根据所述目标双语语句对的匹配特征值,对所述目标双语语句对进行过滤分类,确定所述目标双语语句对是否为符合互译关系要求的双语语句对;其中,所述分类模型是以训练双语语句对为训练对象训练得到的,所述训练以所述训练双语语句对的所述匹配特征值、所述训练双语语句对之间是否具有符合要求的互译关系为依据来进行,所述训练的训练结果包括所述匹配特征值在互译关系中的权重。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山办公软件股份有限公司;珠海金山办公软件有限公司,未经北京金山办公软件股份有限公司;珠海金山办公软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611207663.6/,转载请声明来源钻瓜专利网。