[发明专利]一种中文词库更新系统及方法有效
申请号: | 200610061369.9 | 申请日: | 2006-06-26 |
公开(公告)号: | CN101079037A | 公开(公告)日: | 2007-11-28 |
发明(设计)人: | 余祥鑫;张会鹏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市顺天达专利商标代理有限公司 | 代理人: | 郭伟刚;蔡晓红 |
地址: | 518057广东省深圳市高新科*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 词库 更新 系统 方法 | ||
技术领域
本发明涉及计算机技术领域,更具体地说,涉及一种中文词库更新系统及方法。
背景技术
在通过计算机等输入设备进行中文输入时,通常要使用到中文输入系统。中文输入系统为运行于操作系统上的一个工具软件,其用于把键盘输入的编码或其他非键盘输入的媒体数据转换成汉字输入。目前,中文输入系统可分为键盘输入和非键盘输入,而使用最广的就是基于键盘的中文输入软件。
键盘中文输入系统为利用键盘并根据一定的编码规则来输入汉字的软件。由于键盘上的按键个数有限,而汉字的字数有几万个,因此必须对汉字进行编码,并将这些编码与键盘上的键联系起来,从而可通过键盘输入某个汉字的编码,然后根据编码转换成汉字。目前,汉字的输入通常采用将汉字的音、形或义与特定的键相联系,再进行组合来完成汉字的输入。而非键盘中文输入系统则包括手写输入系统、语音输入系统、OCR输入系统等。
现在中文输入系统还具有学习功能,可以学习用户输入的词或短语,即在第一次输入某一词或短语后,第二次输入相同的词或短语时,只需输入第一个字即可自动显示后续的字,或者通过简写的代码即可显示该词或短语,从而方便了输入。
如图1所示,一般中文输入系统包括有用户接口(User Interface)模块11、备选词查询模块12、核心词典13、用户词典14以及自学习模块15。其中用户接口11模块完成中文输入系统与用户的交互,获取用户输入的拼音或其他编码;备选词查询模块12根据查询算法检索核心词典13和用户词典14,获取最可能的一序列备选字、词或短语;核心词典13是由系统提供的词库,在输入系统安装完成后该词典不会改变;用户词典14是用户自己定义的字、词或短语,或者在使用过程中系统自学习用户输入生成的词、短语组成的词库,随用户使用过程不断增加;自学习模块15用于学习用户输入的词或短语,并把核心词典和用户词典没有的词、短语加入到用户词典。
然而,上述中文输入系统的用户词典都存储在本地存储装置,如果在某台输入设备使用中文输入系统生成的词并加入到用户词典,然后在另一输入设备使用相同的中文输入系统输入相同的词时,必须重新定义这个词,并加入到当前输入设备的中文输入系统的用户词典。即用户需在其使用的所有输入设备中分别定义相同的用户词,生成用户词典,极为不便。另外当用户重新安装中文输入系统时,用户词典往往会丢失,导致用户以前自定义的或曾经自学习得到的词或短语丢失,需要重新定义这些词或短语。
发明内容
本发明要解决的技术问题在于,针对上述在不同终端进行中文词组或短语输入时无法共享用户词典的问题,提供一种中文词库更新系统及方法。
本发明解决上述技术问题的技术方案是,提供一种中文词库更新系统,所述中文词库与中文输入模块连接并包括有位于终端设备的核心词典和用户词典,还包括位于所述终端设备并通过网络连接到服务器的同步模块,所述服务器用于保存与用户词典对应的用户帐号的词典数据,所述同步模块使所述用户词典与服务器中对应用户帐号的词典数据之间保持同步。
在本发明所述的一种中文词库更新系统中,所述服务器包括有存储词典数据的用户数据库以及建立和维护所述用户数据库中词典数据的网络词典模块,所述网络词典模块分别与同步模块和用户数据库连接。
在本发明所述的一种中文词库更新系统中,所述网络词典模块根据用户帐号对用户数据库中的多个不同用户的词典数据进行维护。
在本发明所述的一种中文词库更新系统中,所述同步模块通过定时器定时执行用户词典与用户数据库中对应用户帐号的词典数据的同步操作,或者在启动或关闭中文输入模块时执行同步操作。
在本发明所述的一种中文词库更新系统中,所述同步模块在进行用户词典与词典数据同步时,若用户词典的更新时间早于服务器中对应用户帐号的词典数据的更新时间,则根据所述词典数据更新用户词典;若词典数据的更新时间早于用户词典的更新时间,则根据所述用户词典更新服务器中的词典数据。
在本发明所述的一种中文词库更新系统中,所述同步模块使用更新序列号参数实现最新数据判断,网络词典模块在客户端请求更新一次词典数据的同时使词典数据的更新序列号加1,并在更新时通过更新序列号的值来选择数据进行更新。
本发明还提供一种中文词库更新方法,所述中文词库与中文输入模块连接并包括有位于终端设备的核心词典和用户词典,包括以下步骤:
(a)所述用户词典根据中文输入模块的输入存储中文词组或短语;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610061369.9/2.html,转载请声明来源钻瓜专利网。