[发明专利]建立输入法数据库的系统及其方法无效
申请号: | 200710195146.6 | 申请日: | 2007-11-30 |
公开(公告)号: | CN101452455A | 公开(公告)日: | 2009-06-10 |
发明(设计)人: | 邱全成;周韬 | 申请(专利权)人: | 英业达股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 | 代理人: | 王 漪;王继长 |
地址: | 台湾省台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 建立 输入法 数据库 系统 及其 方法 | ||
技术领域
本发明涉及一种建立数据库的系统及其方法,尤其涉及一种建立输入法数据库之系统及其方法。
背景技术
从数字装置发明以来,输入法的使用就变得非常普遍,几乎只要操作数字装置就会用到输入法,不同的输入法需要不同的输入法数据库,例如:英文输入法需要英文输入法数据库。虽然输入法数据库需求的内容较为单纯,但是在建立输入法数据库时,一般都是采用逐字建立输入法数据库的方式,仍然需要付出相当高的人力成本。
就输入法数据库需求的内容而言,与词典数据库所储存的内容有异曲同工之处,因为词典数据库已储存有输入法数据库所需求的内容。词典数据库建立时,也是采用逐字建立词典数据库的方式,不同的语言就有不同的词典数据库,词典数据库除了储存有输入法数据库所需求的内容,还多了音标,词性,以及例句...等,这些都是输入法数据库所不需要的。
虽然输入法数据库与词典数据库在建立时都相当耗时,而且现有的词典数据库内容也非常完备,但是却无法利用现有的词典数据库直接转换成输入法数据库,主要的原因就是在于词典数据库的建置格式与输入法数据库所需求的建置格式不尽相同,并且还多了许多输入法数据库在利用上所不需要的其它相关内容,即使现有的词典数据库内容已臻完备,却不能被再转用,为了避免重复浪费建置时间和人力,需要有可以直接将词典数据库转换为输入法数据库的技术手段的必要。
综上所述,可知先前技术中长期以来一直存在无法利用现有词典数据库直接转换为输入法数据库的问题,因此有必要提出改进的技术手段,来解决此一问题。
发明内容
有鉴于先前技术存在的无法利用现有词典数据库直接转换为输入法数据库的问题,本发明特提供一种建立输入法数据库的系统及其方法。
本发明所提供的建立输入法数据库的系统,用以从词典数据库进行数据转换,其包含:读取模块,用以从词典数据库加载单词,其中每个单词均具有对应的单词内容;搜寻模块,搜寻单词内容之至少一个词条,当遇到区隔记号时,分开获取词条;加载模块,加载词条中之至少一个候选项,当遇到分隔字符时,分开获取候选项;及输出模块,用以整合候选项并输出至该输入法数据库。
本发明所提供的建立输入法数据库的方法,用以从词典数据库进行数据转换,其包含下列步骤:从词典数据库加载单词,其中每个单词均具有对应的单词内容;搜寻单词内容中之至少一个词条,当遇到区隔记号时,分开获取词条;加载词条中之至少一个候选项,当遇到分隔字符时,分开获取候选项;及整合候选项并输出至该输入法数据库。
本发明所提供的系统与方法如上,与先前技术之间的差异在于本发明通过从词典数据库的单词内容中获取至少一个词条,再从词条加载至少一个候选项,最后输出至输入法数据库的技术手段,可以解决先前技术中所存在的无法利用现有词典数据库直接转换为输入法数据库的问题。
通过上述的技术手段,本发明可以达成资源共享且能够快速建立输入法数据库的技术效果。
附图说明
图1为本发明建立输入法数据库的方法流程图。
图2为本发明建立输入法数据库的系统方块图。
图3A为应用本发明之实施例之方法流程图。
图3B为应用本发明之实施例示意图。
具体实施方式
以下将配合图式及实施例来详细说明本发明之实施方式,由此对本发明如何应用技术手段来解决技术问题并达成技术效果的实现过程能充分理解并据以实施。
本发明是提供一种建立输入法数据库的系统及其方法,以下将同时搭配「图1」之方法流程图以及「图2」之系统方块图进行说明。
本发明之建立输入法数据库的系统200,应用在以现有的词典数据库250直接转换,以建立输入法数据库,本发明并不限于何种语言的词典数据库250,由于不同的词典数据库250可能有不同的储存格式,但是只要词典数据库250中基本上具备可供区分词条以及分隔候选项的特定格式,均可以应用本发明来进行输入法数据库的转换。
虽然词典数据库250的具体格式并不一致,但是如果针对现有的各种词典数据库250的储存格式加以分析,会发现词典数据库250的储存格式都会有一些规则可循,例如:词典数据库250的每个单词均具有对应的单词内容,单词内容中具有词条,词条中会具有候选项,有些词典数据库250使用区隔记号来区分单词内容中的词条,或者使用分隔字符来区分词条中的候选项,而区隔记号与分隔字符的形式并不一定。因此,本发明即是在分析出这些原则的前提下进行输入法数据库的转换,实际的转换过程会因为不同词典数据库250的储存格式而有差异,但基本上转换的原理原则均相同,以下将做进一步说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710195146.6/2.html,转载请声明来源钻瓜专利网。