[发明专利]确定搜索引擎中输入字符串正确性的方法及装置有效
申请号: | 200910076846.2 | 申请日: | 2009-01-22 |
公开(公告)号: | CN101477565A | 公开(公告)日: | 2009-07-08 |
发明(设计)人: | 王勇 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 100084北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 搜索引擎 输入 字符串 正确性 方法 装置 | ||
1.一种确定搜索引擎中输入汉字字符串正确性的方法,其特征在于,包括:
获取用户在搜索引擎中输入的输入汉字字符串;
利用所述输入汉字字符串以及该输入汉字字符串的拼音串在预置的集合中进行查询,所述集合包含具有一一对应关系的查询词和该查询词的汉字拼音串;
判断输入汉字字符串的正确性:如果所述集合中的拼音串与输入汉字字符串的拼音串或输入汉字字符串的拼音串的子串匹配,并且,所述输入汉字字符串中不包含该集合中匹配的拼音串在所述集合中对应的查询词,则确定所述输入汉字字符串存在错误,否则,确定所述输入汉字字符串正确。
2.根据权利要求1所述方法,其特征在于,所述集合的预置过程为:
对查询日志中的查询词进行拼音标注;
计算所述查询词及其对应拼音串在查询日志中出现的次数;
计算所述查询词与其拼音串出现次数的比值;
保留所述比值大于预置的比值阈值的查询词及其拼音串的一一对应关系,构成所述集合。
3.根据权利要求1或2所述方法,其特征在于,如果确定所述输入汉字字符串存在错误,还包括:
以所述集合中的查询词替换输入汉字字符串相应位置的汉字,并利用对原始输入汉字字符串和替换后的汉字字符串进行分词比较,以验证所述输入汉字字符串存在错误的判断结果是否正确;
其中,所述利用对原始输入汉字字符串和替换后的汉字字符串进行分词比较,以验证所述输入汉字字符串存在错误的判断结果是否正确的具体过程为:
对所述输入汉字字符串进行分词,计算词的个数;
利用集合中的查询词替换输入汉字字符串相应位置的汉字,并对替换后的汉字字符串进行分词,计算替换后的汉字字符串中词的个数;
如果替换后的汉字字符串中词的个数大于所述输入汉字字符串中词的个数,则确定所述输入汉字字符串的正确性判断结果是错误的,并将判断结果修改为所述输入汉字字符串正确,否则,维持原来的判断结果。
4.一种确定搜索引擎中输入汉字字符串正确性的装置,其特征在于,包括:
获取单元,用于获取用户在搜索引擎中输入的输入汉字字符串;
查询单元,用于利用所述输入汉字字符串以及该输入汉字字符串的拼音串在预置的集合中进行查询,所述集合包含具有一一对应关系的查询词和该查询词的拼音串;
判断单元,用于判断输入汉字字符串的正确性:如果所述集合中的拼音串与输入汉字字符串的拼音串或输入汉字字符串的拼音串的子串匹配,并且,所述输入汉字字符串中不包含集合中匹配的拼音串在所述集合中对应的查询词,则确定所述输入汉字字符串存在错误,否则,确定所述输入汉字字符串正确。
5.根据权利要求4所述装置,其特征在于,还包括用于建立所述集合的集合建立单元,所述集合建立单元包括:
拼音标注子单元,用于对查询日志中的查询词进行拼音标注;
次数计算子单元,用于计算所述查询词及其对应拼音串在查询日志中出现的次数;
比值计算子单元,用于计算所述查询词与其拼音串出现次数的比值;
集合生成子单元,用于保留所述比值大于预置的比值阈值的查询词及其拼音串的一一对应关系,构成所述集合。
6.根据权利要求4或5所述装置,其特征在于,还包括:
验证单元,用于在确定所述输入汉字字符串存在错误时,以所述集合中的查询词替换输入汉字字符串相应位置的汉字,并利用对原始输入汉字字符串和替换后的汉字字符串进行分词比较,以验证所述输入汉字字符串存在错误的判断结果是否正确;
其中,所述验证单元包括:
个数计算子单元,用于对所述输入汉字字符串进行分词,并计算输入汉字字符串中词的个数;
替换词个数计算子单元,用于利用所述集合中查询词替换所述输入汉字字符串对应位置的汉字,并对替换后的汉字字符串进行分词,计算替换后的汉字字符串中词的个数;
验证子单元,如果替换汉字字符串中词的个数大于输入汉字字符串中词的个数,则确定所述输入汉字字符串正确性判断结果是错误的,将判断结果修改为所述输入汉字字符串正确,否则,维持原来的判断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910076846.2/1.html,转载请声明来源钻瓜专利网。