[发明专利]一种用于搜索输入的推荐系统及方法有效
申请号: | 201210215120.4 | 申请日: | 2012-06-26 |
公开(公告)号: | CN102768681A | 公开(公告)日: | 2012-11-07 |
发明(设计)人: | 胡毅 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 搜索 输入 推荐 系统 方法 | ||
技术领域
本发明涉及搜索引擎技术领域,特别涉及一种用于搜索输入的推荐系统及方法。
背景技术
Suggest(搜索建议)是一种根据用户已输入的查询词,提供建议提示的技术。在互联网中,搜索人的责任就是帮助用户,以更快的速度,更少的操作,更准确地获取待搜索信息。
用户在搜索框中进行输入时,往往要输入很多关键词,还可能会切换输入法。而且用户在输好关键词后,还可能面临输入错误的情况,比如同音别字。最后,用户也可能并不确定输入什么样的关键词,能够非常恰当地代表自己的想法。suggest就是为了提升用户在输入框中输入关键词时的体验,其可以缩短用户的键入,对用户的输入进行纠错,更重要的是可以推荐出很多贴近用户想法的关键词。
实现suggest,一般需要中文到拼音的标注过程和索引查询过程两个环节。拼音标注,就是把中文短语翻译成其相应的拼音,这个过程的难点在于多音字的处理,其一般只在直接根据中文关键词进行索引查询所得推荐词过少的情况下使用。suggest的索引查询通常基于hashmap(基于哈希表的Map接口),查询过程必须性能过硬,因为用户在输入一个关键词的过程中会多次调用suggest服务。
拼音标注环节中,对于多音字的处理,通常的做法,是将多音字的读音进行枚举,比如“音乐”,将其翻译成“yinyue”和“yinle”,将“乐视网”翻译成“yueshiwang”和“leshiwang”。这种翻译单纯基于单个汉字的读音,而不考虑其使用环境。因此,可能会造成冗余的拼音索引,扰乱正确结果,并且不利于引导用户认识到自己的拼音错误。
在由拼音得到中文查询串的过程中,由于对多音字的处理不当,也可能会引入搜索噪音,比如用户在百度搜索框中输入“yueshi”,本想查询月食相关信息,但此时suggest给出的推荐词包括“乐视网”和“钥匙”等明显无关的信息,而“月食”几乎被这些无关信息所淹没。
通常的查询方式,词典里的数据集越大,需要遍历的子树越大,导致查找消耗的时间随数据集的增大而增加,影响用户的使用体验。
发明内容
本发明要解决的技术问题是:如何提供一种用于搜索输入的推荐系统及方法,以提高推荐词查找速度,克服现有方案中推荐词查找速度随数据集的增大而降低的问题。
为解决上述技术问题,本发明提供一种用于搜索输入的推荐系统,所述系统包括:关键词获取单元、查找树存储单元、推荐词词库、地址获取单元和推荐单元;
所述关键词获取单元,适于根据用户输入获得搜索关键词;
所述查找树存储单元,适于以树形数据结构存储汉字,树中每个数据节点存储一个汉字,以及包含所述汉字的推荐词的地址信息;
所述推荐词词库,适于存储所述推荐词;
所述地址获取单元,适于根据所述搜索关键词查询所述查找树存储单元,获得所述推荐词的地址信息;
所述推荐单元,适于根据所述地址信息查询所述推荐词词库获得所述推荐词,并将所述推荐词推荐给用户。
其中,所述用户输入为拼音输入或者中文输入。
其中,所述推荐词词库中还存储对应所述推荐词的拼音;
所述关键词获取单元,适于根据所述拼音输入查询所述推荐词词库,得到所述拼音输入对应的引导中文,并将所述引导中文作为搜索关键词;或者,直接将所述中文输入作为搜索关键词。
其中,所述地址获取单元,适于根据所述引导中文查询所述查找树存储单元,得到所述引导中文为前缀的引导推荐词的地址信息;所述推荐单元,适于根据所述引导推荐词的地址信息查询所述推荐词词库获得相应的推荐词,然后推荐给用户;或者,
所述地址获取单元,适于根据所述中文输入查询所述查找树存储单元,得到所述中文输入为前缀的初级推荐词的地址信息;所述推荐单元,适于根据所述初级推荐词的地址信息查询所述推荐词词库获得相应的初级推荐词,并将所述初级推荐词推荐给用户。
其中,所述系统还包括:多音词词库和标注单元;
所述多音词词库,适于存储中文和所述中文对应的拼音标注;
所述标注单元,适于在所述初级推荐词数量小于预设阈值时,查询所述多音词词库以得到对应所述中文输入的拼音标注;
所述关键词获取单元,还适于根据所述拼音标注再次查询所述推荐词词库,得到所述拼音标注对应的扩展中文;
所述地址获取单元,还适于根据所述扩展中文查询所述查找树存储单元,得到所述扩展中文为前缀的扩展推荐词的地址信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210215120.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:对于上边梁的部件设置结构
- 下一篇:云计算模式下的数据处理方法、设备和系统