[发明专利]计算机资源定位的汉字繁简体转换方法无效

专利信息
申请号: 01119920.2 申请日: 2001-06-29
公开(公告)号: CN1393803A 公开(公告)日: 2003-01-29
发明(设计)人: 李晓东;许乃文;吕爱琴;孙国念;王艳峰;邓翔;张文辉;毛伟 申请(专利权)人: 中国互联网络信息中心;财团法人台湾网路资讯中心
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 中科专利商标代理有限责任公司 代理人: 朱进桂
地址: 100080*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算机 资源 定位 汉字 繁简 转换 方法
【说明书】:

发明涉及计算机汉字处理中的简体字向繁体字以及繁体字向简体字转换的方法,特别是计算机网络的域名注册和解析过程中简体字向繁体字以及繁体字向简体字转换的方法。

目前,在很多机构和组织中要对汉字进行简繁体字的互换工作。在简繁体字互换的过程中主要存在以下三种情况:(1)一个简体字对应一个繁体字;(2)一个简体字对应多个繁体字;(3)一个繁体字对应多个简体字。多数简繁体字的互换是基于语义完成的。由于简繁体字的互换并不是简单的一对一的关系,在处理过程中就要根据文字的上下文关系及语义对多种可能的对应关系进行比较,这就使得计算机要处理大量数据,完成繁简体字转换的资源消耗和工作量会随着转换的成功率的提高而变得非常大,而且这种消耗对于某些相关的计算机的特定应用来说是难以实现的。

在中国的两岸四地对汉字的使用存在着一定的差异。中国大陆使用的是简体中文(编码标准是GB18030),而台湾、香港、澳门使用的是繁体中文(编码标准为BIG5)。但是对普通用户而言,无法严格地要求用户区分繁简体字的使用。即使是在中国大陆,由于历史遗留原因,人们仍然在某些场合使用繁体字。例如,人们在书写店名、招牌、书法的时候多用繁体字,但是在正式的文书中则使用简体字。很多中国人两种书写方式都看得懂,而且这种使用状态可能还要持续很长时间。

随着互连网技术对人们生活的影响日益增大,越来越多的人上网冲浪,在网上查找感兴趣的信息。但是,目前互连网域名的注册方式是采用对输入的字符本身进行注册和解析,即仅注册和解析输入的单一字符。随着中文域名注册服务的开展,越来越多的企业、机构、或个人等正在积极、踊跃地注册自己感兴趣的域名。但由于不同地区对简繁体汉字的使用差异,以及某些人或机构对域名的恶意抢注,造成某些企业、机构、或个人只注册了简体或繁体字的中文域名,而未注册同一名称的繁体或简体字的中文域名,或是注册了简体或繁体字的中文域名,而同一名称的繁体或简体字的中文域名却被他人或机构恶意抢注,给企业或机构造成商业损失和不良影响。人们在上网时,可能存在着想用简体字或繁体字输入表示同一域名的汉字,却出现不同内容的情况,给使用简体或繁体汉字的不同地区的人们在网上检索信息带来不便。

另外,对于计算机资源定位而言,如果采用基于分词和语义分析的繁简体汉字转换方法来实现繁简体字计算机资源的统一定位,虽然也可以实现部分程度的功能,但是有两个缺点:

第一点,由于计算机资源描述的方式仅仅是为了便于记忆,是一种标识符,本身无意义,在没有建立足够庞大的词库和拥有足够的智能之前(现有技术条件下的人工智能是无法达到的),基于分词和语义分析的繁简体字转换方法就无法正确的分词并进行语义分析处理,从而就更无法实现正确、合理的资源定位;

第二点,计算机资源的定位是一种要求简捷高效的网络定位服务,基于分词和语义分析的繁简转换方法由于其实现原理本身的问题而根本无法做到简捷高效。

因此,必须采用合理的方法来实现计算机资源定位中的汉字繁简转换功能。

本发明的目的是提供一种在计算机资源标识注册和解析时能够有效地进行简体向繁体汉字以及繁体向简体汉字互换的方法。在使用计算机资源对中文进行定位的时候,能完成高效的、简捷的、合理的以及无模糊的繁简体及简繁体汉字的转换,定位到相应的计算机资源。

根据本发明用于计算机资源标识注册和解析的简繁体汉字的相互转换方法,其特征在于包括步骤:

a)用户利用输入装置输入中文计算机资源定位标识;

b)用户方发出相应的定位请求,计算机系统将用户的输入内容转换为相应的内码表示形式;

c)应用层程序获取用户的资源定位请求,对请求中的标识编码进行处理,过滤掉非法字符,对一一对应的繁简体字符作映射处理,将标准的资源定位请求发向服务器处理程序;

d)服务方程序,通过相应的汉字简繁体转换处理后,查询用户所需的资源定位信息,并将该资源定位信息提供给用户的应用层程序;

e)根据应用层程序处理返回的资源定位信息,如果没有定位信息,则报错;如果有定位信息,则定位相应的网络资源位置,并获得相应的计算机资源。

另外,服务器中的服务方程序所进行的汉字简繁体转换进一步包括:如果计算机资源定位请求是简体字,直接处理此请求,返回给请求发出方相应的结果;如果计算机资源定位请求是繁体字,在繁体字与简体字一一对应的情况下,作一对一等效处理;在多个繁体字对应一个简体字的情况下,将繁体字等效为简体字;一个繁体字对应多个简体字的情况下,根据服务方的配置情况,将此繁体字等效为简体字。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国互联网络信息中心;财团法人台湾网路资讯中心,未经中国互联网络信息中心;财团法人台湾网路资讯中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01119920.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top