[发明专利]一种字词输入方法及系统有效
申请号: | 201110079201.1 | 申请日: | 2011-03-30 |
公开(公告)号: | CN102135814B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/27;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 逯长明,王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字词 输入 方法 系统 | ||
1.一种字词输入方法,其特征在于,包括:
检测用户输入的编码字符串中存在的错误输入片段;其中,所述编码字符串包括字母、数字、笔画中的一种或者几种;
根据预先获取的合法字符组集合,编辑所述错误输入片段,得到纠错候选字符串,所述合法字符组集合为预先采用对语料库进行统计的方法,基于合法的编码字符串建立的合法字符组集合,合法的编码字符串是指符合语言规则的字符串;
将所述纠错候选字符串转换为输入文字。
2.根据权利要求1所述的方法,其特征在于,所述检测用户输入的编码字符串中存在的错误输入片段包括:
根据当前语境,对所述用户输入的编码字符串进行分词,将得到的分词碎片确定为错误输入片段。
3.根据权利要求1所述的方法,其特征在于,所述检测用户输入的编码字符串中存在的错误输入片段包括:
如果所述用户输入的编码字符串中存在不属于所述合法字符组集合的字符组,或者基于合法字符组集合统计的合法概率小于阈值的字符组,则该字符组为错误输入片段。
4.根据权利要求1所述的方法,其特征在于,所述合法字符组集合通过以下方式获得:从至少两个文字的合法编码字符串连接而成的字符串中抽取合法字符组。
5.根据权利要求1所述的方法,其特征在于,所述根据预先获取的合法字符组集合,编辑所述错误输入片段,得到纠错候选字符串包括:
对所述错误输入片段分别进行基于字符的替换、插入、删除及交换的处理;
如果处理后的片段属于所述合法字符组集合,则基于该处理后的片段生成纠错候选字符串。
6.根据权利要求5所述的方法,其特征在于,所述根据预先获取的合法字符组集合,编辑所述错误输入片段,得到纠错候选字符串包括:
去除合法字符组中设定位置的至少一个字符,将其他剩余字符按设定顺序排列作为所述被去除字符的索引;
以合法字符组集合的若干个所述索引及对应的被去除字符组成反查字符组集合;
当需要对所述错误输入片段在所述设定位置进行字符的替换或插入时,根据所述错误输入片段以所述设定顺序生成查询串;
从所述反查字符组集合中获取以所述查询串为索引的字符,将该字符作为在所述设定位置替换或插入的字符,得到纠错候选字符串。
7.根据权利要求6所述的方法,其特征在于,所述设定位置包括合法字符组中首字符位置以外的其他位置。
8.根据权利要求6所述的方法,其特征在于,所述合法字符组集合及所述反查字符组集合以树形结构进行保存。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述将纠错候选字符串转换为输入文字包括:
对所述纠错候选字符串进行评估;
根据评估的结果,对所述编码字符串及符合预置条件的纠错候选字符串进行转换,并向用户展现转换的结果。
10.根据权利要求1至8任一项所述的方法,其特征在于,还包括:
将所述用户输入的编码字符串发送到远端服务器,并接收所述远端服务器返回的纠错候选字符串。
11.根据权利要求1至8任一项所述的方法,其特征在于,还包括:
如果所述用户输入的编码字符串命中设定词库,根据所述设定词库将所述编码字符串转换为输入文字。
12.一种字词输入系统,其特征在于,包括:
检错单元,用于检测用户输入的编码字符串中存在的错误输入片段;其中,所述编码字符串包括字母、数字、笔画中的一种或者几种;
纠错单元,用于根据预先获取的合法字符组集合,编辑所述错误输入片段,得到纠错候选字符串,所述合法字符组集合为预先采用对语料库进行统计的方法,基于合法的编码字符串建立的合法字符组集合,合法的编码字符串是指符合语言规则的字符串;
转换单元,用于将所述纠错候选字符串转换为输入文字。
13.根据权利要求12所述的系统,其特征在于,所述检错单元包括:
第一检错子单元,用于根据当前语境,对所述用户输入的编码字符串进行分词,将得到的分词碎片确定为错误输入片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110079201.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:掺杂改性锆酸锶基中高压瓷介电容器材料
- 下一篇:一种治疗糖尿病的中药组合物