[发明专利]一种基于云计算的术语译文挖掘方法在审
申请号: | 201410323357.3 | 申请日: | 2014-07-09 |
公开(公告)号: | CN104166644A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 梁颖红;姚建民;洪宇;鲜学丰;叶良 | 申请(专利权)人: | 苏州市职业大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30;H04L29/08 |
代理公司: | 苏州铭浩知识产权代理事务所(普通合伙) 32246 | 代理人: | 王军 |
地址: | 215104 江苏省苏州市吴中*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 计算 术语 译文 挖掘 方法 | ||
1.一种基于云计算的术语译文挖掘方法,其特征在于,包括:云计算硬件与软件系统平台的搭建和从所述云计算硬件与软件系统平台中抽取译文的术语译文挖掘技术;所述术语译文挖掘技术包括有效摘要资源的获取、候选翻译单元的自动抽取和译文的选择;所述云计算硬件与软件系统平台的搭建包括搭建服务器群,建立并行计算系统,构建分布式数据库系统,以网络的方式与客户端交互,构建云计算系统;所述云计算系统将多个服务器及磁盘阵列组成存储和运算系统,各服务器中安装分布式数据库,架设并行计算系统查找数据库中的术语翻译知识;将术语翻译知识建立多级标签,先通过搜索算法在各级标签中查询,找到后提供相应的术语翻译信息,满足条件时从库中把译文返回给用户,如果在内部群中无法找到术语的译文,通过内部云与外部云的接口到外部云查找术语的译文。
2.根据权利要求1所述的一种基于云计算的术语译文挖掘方法,其特征在于:所述分布式数据库系统由逻辑上统一、物理上分散于计算机网络若干站点上的一组数据组成,采用SQL Server以XML作为中间媒介,实现分布式数据库之间的数据协同查询处理。
3.根据权利要求1所述的一种基于云计算的术语译文挖掘方法,其特征在于:所述有效摘要资源的获取利用一种基于共现信息的查询扩展方法,首先将源查询词提交搜索引擎,获取包含源查询的源语言摘要信息,然后利用TF-IDF从获得的源语言摘要信息抽取和源查询共现的主题词汇;获得主题词汇后,从双语词典中查找主题词汇的译文,把源查询和这些主题词汇的译文进行跨语言扩展,将扩展后的查询再次提交搜索引擎来获取双语摘要资源。
4.根据权利要求1所述的一种基于云计算的术语译文挖掘方法,其特征在于:所述候选翻译单元的自动抽取采用FCM聚类算法从获得的双语摘要资源中抽取候选翻译单元,结合频度变化度量和邻接信息;FCM公式如下:
其中,S是一中文字符串,f(S)是字符串S的频度,xi是S中每一个字符的频度,是S中所有字符的平均频度。
5.根据权利要求1所述的一种基于云计算的术语译文挖掘方法,其特征在于:所述译文的选择通过综合采用频度-距离模型、表层模板匹配和音译模型从候选翻译单元集合中抽取译文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州市职业大学,未经苏州市职业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410323357.3/1.html,转载请声明来源钻瓜专利网。