[发明专利]一种垂直搜索设备及方法在审
申请号: | 201310487578.X | 申请日: | 2013-10-17 |
公开(公告)号: | CN103530380A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 耿祥磊 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 刘杰 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 垂直 搜索 设备 方法 | ||
技术领域
本发明涉及垂直搜索技术领域,具体涉及一种用于垂直搜索设备,以及一种垂直搜索方法。
背景技术
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
用户进行垂直搜索时,输入的关键词可能是汉语文字,也可能是汉语拼音。
如果用户输入的关键词是汉语文字,目前通用的做法是:直接根据汉语文字在信息库中进行搜索,但是如果用户输入的关键词是错别字,那么往往搜索不到用户期望的结果。比如用户原本应该在游戏垂直搜索引擎中输入搜索关键词“七雄”,进而搜索到“七雄争霸”这款游戏结果,但是因为种种原因,用户可能输入的是错别字词“气胸”,这种情况下按照目前通用的做法就无法搜索到“七雄争霸”这款用户期望的游戏结果。
如果用户输入的关键词是汉语拼音,目前通用的做法是:将用户输入的汉语拼音提交给某个通用拼音搜索的接口,通过该接口转化为相应的汉字词语(一个或多个),然后返回的汉字词语作为搜索关键词进行搜索并给出结果。本发明的发明人发现,由于汉字以及词语的同音字、同音词比较多,这样用户在输入拼音之后,经过通用拼音搜索接口转化而来的同音词语也比较多,这些词语与当前垂直搜索涉及领域的内容未必能完全匹配或者匹配不准确,进而导致在以这些关键词进行搜索时,结果可能不是用户所期望的。比如,用户在游戏领域进行垂直搜索时,输入了拼音“qixiong”,提交给通用拼音搜索接口后可能返回“气胸”,“齐胸”等词语,而使用这些关键词在游戏领域的垂直搜索中无法搜索到用户期望的结果“七雄争霸”。
发明内容
鉴于上述问题,提供一种克服上述问题或者至少部分地解决上述问题的垂直搜索设备和相应的垂直搜索方法。
根据本发明一个实施例,提供了一种垂直搜索设备,包括:交互接口,被配置为获取关键词,所述关键词中至少包括汉语文字和/或汉语拼音;转换器,被配置为将经由所述交互接口获取到的关键词中的汉语文字转换为相关的汉语拼音;以及搜索器,被配置为根据关键词对应的汉语拼音在垂直搜索信息库中搜索相匹配的搜索结果,所述垂直搜索信息库至少包括汉语拼音形式的索引项以及每个索引项对应的搜索结果。
可选的,转换器还被配置为将用作相应数据索引信息的汉语文字转换为相关的汉语拼音,所述搜索设备还包括:索引构造器,被配置为将上述汉语拼音添加至所述垂直搜索信息库作为相应数据的索引项。
可选的,所述转换器包括:直接转换模块,被配置为按照汉语文字与汉语拼音之间的对应关系,以及预置的分词方式,将汉语文字转换为若干相关的汉语拼音。
可选的,所述转换器还包括:模糊音转换模块,被配置为根据不同汉语拼音之间的模糊音对应关系,得到与所述直接转换模块提供的汉语拼音具有模糊音对应关系的其他汉语拼音,所述其他汉语拼音也作为所述汉语文字相关的汉语拼音。
可选的,所述搜索器还被配置为在将关键词中的汉语文字转换为相关的汉语拼音之前,根据所述汉语文字在垂直搜索信息库中搜索相匹配的搜索结果,如果搜索到,则直接返回搜索结果。
根据本发明另一个实施例,还提供了一种垂直搜索方法,包括:获取关键词,所述关键词中至少包括汉语文字和/或汉语拼音;将所述关键词中的汉语文字转换为相关的汉语拼音;根据关键词对应的汉语拼音在垂直搜索信息库中搜索相匹配的搜索结果,所述垂直搜索信息库至少包括汉语拼音形式的索引项以及每个索引项对应的搜索结果。
可选的,还包括:将用作相应数据索引信息的汉语文字转换为相关的汉语拼音;以及将所述汉语拼音添加至所述垂直搜索信息库作为相应数据的索引项。
可选的,所述将汉语文字转换为相关的汉语拼音的步骤包括:按照汉语文字与汉语拼音之间的对应关系,以及预置的分词、排列组合方式,将汉语文字转换为若干相关的汉语拼音。
可选的,所述将汉语文字转换为相关的汉语拼音的步骤还包括:根据不同汉语拼音之间的模糊音对应关系,得到与上述汉语拼音具有模糊音对应关系的其他汉语拼音,所述其他汉语拼音也作为所述汉语文字相关的汉语拼音。
可选的,在将所述关键词中的汉语文字转换为相关的汉语拼音步骤之前,还包括:在所述垂直搜索信息库中根据所述汉语文字搜索相匹配的搜索结果,如果搜索到,则直接返回搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310487578.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:药品分配装置及容器识别装置
- 下一篇:一种苯丙氨醇化合物的制备方法