[发明专利]一种语料检索匹配方法在审
申请号: | 201510999938.3 | 申请日: | 2015-12-28 |
公开(公告)号: | CN105677706A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 张光凌 | 申请(专利权)人: | 武汉传神信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/28 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 刘林 |
地址: | 430073 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语料 检索 匹配 方法 | ||
技术领域
本发明所属技术领域为自然语言处理、信息检索,尤其涉及一种语料检索匹配方法。
背景技术
随着翻译技术的飞速发展,各种各样的翻译系统随处可见,各种各样的术语语料库也 种类繁多、参差不齐,随着术语语料库中术语语料数量的几何式增长,现在都达到千万级, 甚至是亿级了,搜索起来速度慢,而且返回搜索结果多,很难查询到译员真正想查的术语 语料。迫切需要一种对术语语料的搜索排序方法,来加快译员对术语语料的搜索速度,甚 至根据译员经常使用的术语语料库、行业、语种,对译员进行术语语料的推荐,达到译员 快速搜索的目的,以加快译员的翻译速度和效率。
发明内容
本方法优化术语语料搜索排名的方法,通过登录译员在翻译过程中对术语语料的匹配 次数、搜索次数、使用次数、修改次数等活跃度因子进行统计和记录,使译员在翻译过程 中使用术语语料库时,系统能自动根据这些活跃度因子对术语语料的搜索结果进行排序, 已达到译员在翻译过程中迅速搜索到想要的术语语料。
为解决上述技术问题,本发明提供一种语料检索匹配方法,包括如下步骤:
1)导入文档,在若干个语料库中进行术语语料检索,进行语料匹配,并记录匹配次 数;
2)查询术语语料,并记录查询次数,记录;
3)使用术语语料,记录术语语料使用次数;
所述语料与所在的语料库进行关联显示。
优选地,所述语料匹配的方法是将语料的检索结果根据语料的活跃度排序,并降序显 示,所述语料的活跃度是对语料的匹配次数、查询次数、使用次数作为因子进行统计得出 的统计结果。
优选地,所述语料匹配的方法将语料的检索结果根据语料库的活跃度排序,并降序显 示,所述语料库的活跃度是对语料库中所有语料的活跃度进行加权得出。
优选地,所述语料匹配的方法将语料的检索结果根据术语语料的使用次数排序,并降 序显示。
优选地,所述使用术语语料包括完全使用语料,所述完全使用语料的步骤是判定所述 查询的术语语料完全正确,无需修改,则标记并完全使用。
优选地,所述使用术语语料包括编辑使用语料,所述编辑使用语料的步骤是判定所述 查询的术语语料部分有误,需要修改编辑,则标记并进行修改编辑保存。
优选地,所述编辑使用语料的步骤还包括保存所述编辑使用语料的历史版本和修改记 录。
本发明的有益效果是:
1)在译员翻译过程中,对术语语料的匹配次数、搜索次数、使用次数、修改次数等 活跃度因子进行统计,进而统计术语语料的活跃度。
2)搜索中根据术语语料的活跃度对搜索结果进行排序,活跃度越高排名越靠前,使 译员能迅速找到经常在使用的术语语料。
3)加快了译员在翻译中查询术语语料的速度。
4)记录译员使用库的频率,优先向译员推荐该库,及该库中术语语料。
5)记录译员使用、查询、修改的术语语料,优先向译员推荐这些术语语料。
6)译员在翻译中可以对有误的术语语料进行修改。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的 示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,在附图中:
图1为本发明的一种步骤示意图;
图2为本发明的另一种步骤示意图。
具体实施方式
下面结合附图和具体实施方式对本发明的技术方案作进一步具体说明。
如图1所示,本发明提供一种语料检索匹配方法,包括如下步骤:
1)导入文档,在若干个语料库中进行术语语料检索,进行语料匹配,并记录匹配次 数;
2)查询术语语料,并记录查询次数,记录;
3)使用术语语料,记录术语语料使用次数;
所述语料与所在的语料库进行关联显示。
优选地,所述语料匹配的方法是将语料的检索结果根据语料的活跃度排序,并降序显 示,所述语料的活跃度是对语料的匹配次数、查询次数、使用次数作为因子进行统计得出 的统计结果。
优选地,所述语料匹配的方法将语料的检索结果根据语料库的活跃度排序,并降序显 示,所述语料库的活跃度是对语料库中所有语料的活跃度进行加权得出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉传神信息技术有限公司,未经武汉传神信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510999938.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:期刊信息管理系统
- 下一篇:一种基于集合运算的中文地址行政区划解析方法