[发明专利]一种向用户词库中记录信息的方法和装置有效
申请号: | 200710121755.7 | 申请日: | 2007-09-13 |
公开(公告)号: | CN101388011A | 公开(公告)日: | 2009-03-18 |
发明(设计)人: | 杨磊 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 100084北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 词库 记录 信息 方法 装置 | ||
技术领域
本发明涉及计算机字符输入技术领域,特别是涉及一种向用户词库中记录信息的方法和装置,一种用户词库以及利用该用户词库进行字符输入的方法和系统。
背景技术
随着计算机技术以及互联网技术的普及与发展,输入法已经成为用户与计算机交互的重要手段,不同专业领域、不同兴趣以及使用习惯的用户对于输入法的智能性要求越来越高。
现有技术一般通过提高系统词库中的词条的更新程度以及词频信息的准确度,来提高用户向计算机完成字符输入时的效率——可以通过首选词的准确率进行评价。例如,申请号为200610086577.4,名称为“基于互联网信息的输入法词频库的生成方法和系统”的中国专利就公开了这样的一种提高系统词库性能的技术方案。
但是由于系统词库是相对固定的,针对每一个用户而言,难以达到精确匹配;为了增强个性化的输入效率,现有技术提出了用户词库的解决方案。用户词库的形成方法通常包括以下步骤:记录用户输入的字词,学习某个用户适用的词汇;通过一段时间地不断学习,将词库逐渐收敛到某个用户输入的最佳状态,从而形成用户词库。显然,这种用户词库的形成过程可以在一定程度上调整候选项的排序,使其逐渐适应该用户,从而提高输入效率,但是对于同一个词,在不同的输入环境下,即使同一用户也可能需要不同的候选项排序。例如,对于“语料”和“预料”,在日常输入中,用户输入“预料”一词的情况较高,在系统词库和用户词库中都是“预料”的词频或者排序要高于“语料”;但是当该用户在输入专业文档时(例如,语言分析相关专业),则就期望“语料”候选项排序在前,而无论系统词库还是用户词库仍然会按照通常的排序输出,无法随着用户输入需求的变化而变化。
因此,现阶段需要本领域技术人员迫切解决的一个技术问题就是,如 何改变现有输入法系统的智能性不高的现状,提供一种能够动态的与用户输入环境或者输入内容相匹配,大大提高用户输入过程中首选词准确率的输入法解决方案。
发明内容
本发明所要解决的技术问题是提供一种向用户词库中记录信息的方法和装置,以及一种用户词库,能够方便快捷的记录用户输入字词的分环境信息,从而提供更加适应该用户输入习惯的用户词库。
相应的,本发明还提供了一种利用上述用户词库完成字符输入的方法和系统,能够动态的与用户输入环境或者输入内容相匹配,大大提高用户输入过程中首选词准确率。
为了解决上述问题,依据本发明的实施例,本发明公开了一种向用户词库中记录信息的方法,具体可以包括:预置用户词库的记录格式,将每个字词的属性信息存储空间划分为多个子空间,用于记录该字词在不同类别下的属性信息;所述属性信息至少包括词频信息;当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别;将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。
优选的,该方法还可以包括:汇集一字词在各个类别下的属性信息并进行处理,得到针对该字词的通用属性信息。
优选的,该方法还可以包括:动态调整对所述子空间的划分。
优选的,该方法还可以包括:通过用户选择的方式确定当前输入类别。
进一步,可以通过以下步骤确定该用户的当前输入类别:预置对应信息表,所述对应信息表用以存储类别信息及对应的输入环境相关信息;所述输入环境相关信息包括应用程序名称、网站地址、当前窗口的标题、文档位置或者文档名称中的至少一个;根据所采集的当前输入环境相关信息,在所述对应信息表查找对应的类别信息,得到当前输入类别。
如果所采集的当前输入环境的相关信息包括用户在当前输入环境中所涉及的文本数据;则通过对所述文本数据进行分析,确定该用户的当前输入类别。
优选的,可以通过以下方式获取用户在当前输入环境中所涉及的文本数据:通过相应的系统函数获取剪贴板中的数据;或者,通过相应的系统函数获取当前应用程序所操作的文件名称及其路径,进而扫描获取该文件的内容数据;或者,通过相应的系统函数获取当前应用程序向屏幕输出的数据;或者,通过网页浏览器的接口对象,获取当前页面的内容数据。
优选的,当所确定的当前输入类别为多个时,则将词频信息同时记录至多个相应子空间或者分权重记录至多个相应子空间。
依据本发明的实施例,还公开了一种向用户词库中记录信息的装置,包括:
用户词库,所述用户词库中每个字词的属性信息存储空间由多个子空间构成,用于存储该字词在不同类别下的属性信息;所述属性信息至少包括词频信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710121755.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种进行数据统计的方法及装置
- 下一篇:一种基于数据差异的逻辑卷快速同步方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置