[发明专利]互联网中文简繁字转换系统及方法在审

专利信息
申请号: 201310215166.0 申请日: 2013-05-31
公开(公告)号: CN103559178A 公开(公告)日: 2014-02-05
发明(设计)人: 刘家丰;周思达;廖发源;谭茜霞;刘润泽 申请(专利权)人: 武汉中文百科网络有限公司;北京四海书同文国际文化交流中心
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 北京华沛德权律师事务所 11302 代理人: 刘丽君
地址: 430035 湖北省武汉市*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 互联网 中文 简繁字 转换 系统 方法
【说明书】:

技术领域

发明涉及中文简繁转换技术领域,特别涉及一种互联网中文简繁字转换系统及方法。 

背景技术

中国大陆地区从上世纪60年代开始全面使用简化字,而台港澳地区以及海外华人华语社区依然使用繁体字。此外,中国大陆在古籍出版、古汉语教学研究以及某些对外交往中,仍然使用繁体字。汉字繁简体并存这一客观情况,对汉字的简繁文本转换提出了要求;同时由于海峡两岸文化、经贸活动广阔度、频繁度的增加和交流程度的深入,两岸民众均对繁简字的准确转换提出了越来越迫切和更高级的要求。 

近十多年来,学术界和互联网界都有不少专家、学者对繁简字的转换进行了研究和探索,研制了不少繁简字转换工具或转换系统,但至今尚无一种能够在中国“大陆简化字”与“台湾繁体字(有人称正体字)”之间准确转换的工具或系统。 

目前在互联网上使用较为广泛和较多的繁简字转换工具或转换系统有:金山词霸的“繁体字简体字转换”、google(谷歌)翻译软件中的“繁简字转换”以及百度搜索中的“繁简字转换”。以上三种繁简字转换工具或转换系统,在实现“简化字”与“繁体字”的转换时,都只能部分地实现“简化字”与“繁体字”的转换,不能达到准确转换的目的。 

发明内容

有鉴于此,本发明的目的在于提供一种互联网中文简繁字转换系统及方法,用于实现“简化字”与“繁体字”的准确转换。 

本发明提供了一种互联网中文简繁字转换系统,包括: 

分词模块,用于对输入的语句进行分词,不同的语义分出不同的字和词组; 

符号处理模块,用于对简体语句与繁体语句中的不相同符号进行转换; 

词组处理模块,用于对分词后简体的词组进行繁体转换; 

字处理模块,用于将简体字转换为繁体字; 

综合处理模块,用于对简体和繁体字词在不同语境中的不同用法进行转换。 

本发明还提供了一种互联网中文简繁字转换方法,包括: 

将输入的语句进行分词,不同的语义分出不同的字和词组; 

将简体语句与繁体语句中的不相同符号进行转换; 

对分词后简体的词组进行繁体转换; 

将简体字转换为繁体字; 

对简体和繁体字词在不同语境中的不同用法进行转换。 

本发明实现了互联网及计算机领域内繁简词汇的准确转换,提供了准确的简繁转换工具。例如: 

应用程序接口(大陆简体)—转换—→應用程式介面(台湾繁体) 

服务器(大陆简体)—转换—→伺服器(台湾繁体) 

带宽(大陆简体)—转换—→頻寬(台湾繁体) 

云计算(大陆简体)—转换—→雲端運算(台湾繁体) 

其次,本发明用技术手段实现了海峡两岸民众在互联网上的交流,若大陆网站使用本系统,可以方便台湾民众阅览,提高网站对台湾民众的亲和力、亲切感。 

最后,大陆地区的运营性网站运营本系统制作繁体版,方便台湾地区民众(在繁体版上)认读、识别产品名称,有利于交易的达成,因而也将有利于提升网站的市场竞争力。例如,在农产品名称方面: 

菠萝(大陆简体)—转换—→鳳梨(台湾繁体) 

猕猴桃(大陆简体)—转换—→奇異果(台湾繁体) 

番石榴(大陆简体)—转换—→芭樂(台湾繁体) 

西兰花(大陆简体)—转换—→花椰菜(台湾繁体) 

附图说明

图1为本发明实施例提供的互联网中文简繁字转换系统结构图; 

图2为本发明实施例中分词模块的结构图; 

图3为本发明实施例中“台湾大学”网站首页首屏截屏图。 

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。 

如图1所示,本实施例提供的互联网中文简繁字转换系统主要有五个模块:符号处理模块、词组处理模块、字处理模块、综合处理模块以及分词模块。 

分词模块11,用于对输入的语句进行分词,不同的语义能分出不同的字和词组。如图2所示,分词模块11具体包括: 

语句分词单元111、用于将语句分成单个字,如:王晓平在1月份滦南大会上说的确实在理,切分为:王/晓/平/在/1/月/份/滦/南/大/会/上/说/的/确/实/在/理 

组合词组单元112、用于通过词库检索对每个词之间进行组合计算所有可能的词组,得到所有词组的组合: 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中文百科网络有限公司;北京四海书同文国际文化交流中心,未经武汉中文百科网络有限公司;北京四海书同文国际文化交流中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310215166.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top