[发明专利]拼音文字词库构建方法和装置及输入方法和系统在审
申请号: | 201310713785.2 | 申请日: | 2013-12-20 |
公开(公告)号: | CN104731766A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 张岩 | 申请(专利权)人: | 淘宝(中国)软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06F3/0482 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙) 11397 | 代理人: | 张艳 |
地址: | 311100 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拼音文字 词库 构建 方法 装置 输入 系统 | ||
技术领域
本发明涉及电子设备领域,尤其是拼音文字词库构建方法和装置,以及拼音文字输入方法及系统。
背景技术
目前,随着计算机、平板电脑、智能手机的广泛使用,除了键盘输入之外,也出现了其他输入法,比如语音输入。但是,键盘输入法仍然是最常用的输入方式。应当指出,本申请文件中提及的键盘输入法不仅包含利用物理键盘的输入法,还包括利用虚拟键盘的输入法。
目前,通行的计算机拼音文字键盘均为逐字母输入法,是由打字机键盘直接照搬过来,在拼音文字输入时存在击键次数过多,输入速度慢,出错率高。并且由于输入完全依赖单词的拼写形式,因此盲输时困难很大。拼音文字是一种表音文字,逐字母输入发使拼音语言的这一特征优势无法发挥出来,使计算机拼音文字输入始终处于低效状态,与计算机技术与高速信息处理技术的飞速发展形成鲜明的对比和矛盾。应当指出,在本申请文件中,拼音文字指的是基于字母的各种语言文字,单词由包含于一定数量字母集合中的若干字母排列组合而构成,不同词之间用比如空格等分词符分隔开,比如英文、德文、法文等,但并不限于这几种语言。
为了提高输入速度,现在已经出现了很多拼音文字输入法,在用户输入一个单词的前若干个字母后,可以依据词库进行智能提示,用户可以据此选择目标单词,从而用户可以减少输入字母,一定程度上提高输入速度。以英文输入为例,比如用户输入ea两个首字母,则输入法可自动提示each、earth、ear、early等以ea开头的英文词汇,用户继续输入ear,则更新为提示earth、ear、early等以ear开头的英文词汇。在此期间,用户可以通过鼠标点击选择或用每个提示词汇前对应的数字代码来选择相应词汇。
但是,仍然期望能进一步提高输入速度。对于输入速度的提高而言,词库构建是非常关键的因素,但目前各种词库均限于单个单词的词库。
发明内容
本发明针对上述问题,提出了一种拼音文字词库构建方法和装置以及拼音文字输入方法和系统,其能进一步提高输入速度。
在一个方面,本发明提供了一种拼音文字词库构建方法,包括以下步骤:动态地获取用户输入的字符串;分析所述字符串,确定其中由分词符分隔的字符串片段,将其视为拼音文字单词并记录下来;记录其中词库中不存在的拼音文字单词出现的次数;以及如果所述拼音文字单词出现的次数已达到阈值,则将所述拼音文字单词存储于词库中;分析所述拼音文字单词之间的关联关系,即单词出现的前后关系,并将其前后关系记录下来;记录所述拼音文字单词之间的关联关系出现的次数;以及如果所述关联关系出现的次数已达到阈值,则将所述单词之间的关联关系存储于词库中。
在另一个方面,本发明提供了一种拼音文字词库构建装置,包括:字符串获取模块,用于动态地获取用户输入的字符串;分析记录模块,用于分析所述字符串,确定其中由分词符分隔的字符串片段,将其视为拼音文字单词并记录下来;其还用于分析所述拼音文字单词之间的关联关系,即单词出现的前后关系,并将其前后关系记录下来;词库,用于存储单词以及单词之间的关联关系;以及存储模块,用于记录其中词库中不存在的拼音文字单词出现的次数,并且如果所述拼音文字单词出现的次数已达到阈值,则将所述拼音文字单词存储于词库中;以及用于记录所述拼音文字单词之间的关联关系出现的次数,并且如果所述关联关系出现的次数已达到阈值时,将所述单词之间的关联关系存储于词库中。
在又一个方面,本发明提供了一种拼音文字输入方法,其包括以下步骤:接收用户输入;显示词库中与用户输入相匹配的字符串,供用户从中选择最终输入字符串;其中,所述字符串包括单词以及具有关联关系的单词组合。
在再一个方面,本发明提供了一种拼音文字输入系统,其包括:用户接口控制模块,用于接收用户输入;词库,用于存储单词和单词之间的关联关系;显示模块,用于显示输入界面;以及输入法引擎,用于根据用户输入的拼音文字字符到词库中搜索匹配的字符串,并将匹配的字符串显示于显示模块上,其中所述字符串包括单词以及具有关联关系的单词组合。
相比现有的拼音文字词库构建方法和装置以及拼音文字输入法和系统,采用本发明能够大幅提高输入速度。
附图说明
下面将参照附图描述本发明的具体实施例,其中:
图1示出了根据本发明实施例的拼音文字词库构建方法的流程图;
图2示出了根据本发明实施例的拼音文字词库构建装置的结构示意图;
图3示出了根据本发明实施例的拼音文字输入方法的流程图;并且
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淘宝(中国)软件有限公司;,未经淘宝(中国)软件有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310713785.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本情感分析方法及系统
- 下一篇:在网络中做出基于策略的决策的方法和系统