[发明专利]一种翻译文档存储与检索的方法在审
申请号: | 201611237773.7 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106777268A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 张光凌 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06F17/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 翻译 文档 存储 检索 方法 | ||
1.一种翻译文档存储与检索的方法,其特征是包括如下步骤:
获取译稿库,所述译稿库包括若干语料和与语料对应的特征标签,所述语料包括原文、与原文对应的译文,所述特征标签包括译员信息、语种、行业;
对译稿库中的原文和译文进行断句处理,形成句子列表,所述句子列表包括若干个句子单元;
对句子列表中的句子单元进行语料对齐;
按照特征标签,对语料进行分类存储;
获取待译稿,输入查询标签,所述查询标签包括语种、行业;
对待译稿进行断句处理,形成句子列表;
对待译稿设置检索参数,所述检索参数包括句子列表、查询标签,用待译稿的检索参数在译稿库中进行语料检索,及语料匹配;
所述匹配包括完全匹配和模糊匹配;
记录语料的完全匹配次数;
记录语料的模糊匹配次数;
设置完全匹配次数的加权系数与模糊匹配次数的加权系数,将完全匹配次数与模糊匹配次数进行加权计算;
其中,所述完全匹配次数的加权系数与模糊匹配次数的加权系数的和等于1,所述完全匹配次数的加权系数大于模糊匹配次数的加权系数;
获取检索匹配到的结果,所述检索结果包括匹配到的译员信息、译员信息对应的译稿库中的原文和译文的句子列表及匹配度,按照匹配度显示。
2.根据权利要求1所述的一种翻译文档存储与检索的方法,其特征是所述对译稿库中的原文和译文进行断句处理,是将原文和译文转换成纯文本信息,并做段落对齐,将对齐后的段落进行断句处理。
3.根据权利要求1所述的一种翻译文档存储与检索的方法,其特征是所述对待译稿进行断句处理,是将待译稿转换成纯文本信息,并做段落对齐,将对齐后的段落进行断句处理。
4.根据权利要求1所述的一种翻译文档存储与检索的方法,其特征是所述模糊匹配是:将待译稿的句子列表做分词处理,去掉停用词和无意义的连接词、介词,然后把待译稿的句子列表的分词内容与译稿库中译文的句子单元做模糊匹配,统计相似度大于50%的句子个数。
5.根据权利要求1所述的一种翻译文档存储与检索的方法,其特征是所述设置完全匹配次数的加权系数与模糊匹配次数的加权系数,是根据经验值进行设置。
6.根据权利要求5所述的一种翻译文档存储与检索的方法,其特征是所述完全匹配次数的加权系数的经验值是70%,所述模糊匹配次数的加权系数的经验值是30%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611237773.7/1.html,转载请声明来源钻瓜专利网。