[发明专利]一种实现信息搜索的方法及系统有效
申请号: | 200610127662.0 | 申请日: | 2006-09-05 |
公开(公告)号: | CN101140573A | 公开(公告)日: | 2008-03-12 |
发明(设计)人: | 吴泳铭;梅坚;余斯恒;王磊;张立中 | 申请(专利权)人: | 阿里巴巴公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 魏杉 |
地址: | 英属开曼群岛*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 信息 搜索 方法 系统 | ||
技术领域
本发明涉及计算机及通信技术领域,尤其涉及一种实现信息搜索的方法及系统。
背景技术
随着网络技术的发展,当用户希望从众多网络信息中获得到自己关心的信息时,用户只需要登录搜索系统,输入自己关心的信息的关键词,搜索系统将根据用户输入的关键词检索出关联的信息反馈给用户。
在搜索系统中预先记录了发布信息的用户提供的信息,并建立了与该信息对应的索引文件,当接收到用户的搜索请求后,系统将自动根据用户输入的关键词查询索引文件,并将查找到的与关键词匹配的索引文件对应的信息发送给用户。
参阅图1所示,现有技术中对发布信息的用户提供的信息的处理过程如下:
步骤101、当发布信息的用户输入信息及该信息对应的关键词后,记录用户输入的信息和关键词。
步骤102、将记录的关键词进行分词处理。
步骤103、分别对分词处理后生成的每一个词建立一个索引,并将每一个索引关联到用户输入的信息上。
参阅图2所示,现有技术中对用户搜索信息的处理过程如下:
步骤201、当用户输入查询信息的关键词后,对该关键词进行分词处理。
步骤202、根据分词处理后的每一个词对应的索引分别查询到匹配的信息。
步骤203、将查询到的信息中的相同信息进行合并。
步骤204、分析经过合并的信息与用户输入关键词的相关度,并根据相关度将所述信息进行排序后提供给用户。
采用现有技术的方法,根据用户输入的关键词进行查找后,将查找到的结果进行合并,并将合并后的结果与用户输入的关键词进行相关性分析找出最相关的结果提供给用户。例如:当用户输入查询关键词“北京鲜花”后,系统进行分词处理,生成“北京”和“鲜花”两个词,然后根据“鲜花”对应的索引找出所有包含“鲜花”的信息,再根据“北京”对应的索引找出所有包含“北京”的信息,将查找到的信息中包含的相同信息进行合并,并找出合并后的信息中同时包含这两个词的信息,最后对该信息进行相关性判断,获得最相关的结果提供给用户。
采用上述方法,发布信息的用户输入的关键字是“北京鲜花”,搜索信息的用户输入的是“鲜花北京”或“北京的鲜花”,则用户发布的信息可能不会被提供给搜索信息的用户,搜索信息的结果和时间与输入关键词的顺序有关;当用户所输入的查询词包含多个词时,需要进行多次查询,并对查询到的多个结果进行合并,还需要将合并结果进行相关性分析才能将分析得到的结果提供给用户,不仅处理繁琐,而且查找效率低下。
发明内容
本发明提供一种处理用户搜索的方法及系统,用以解决现有技术中存在的用户搜索信息时,需要根据用户输入的多个关键词分别进行搜索,还需要将搜索后获得的信息进行合并及进行相关性分析后才能提供给用户,以及搜索信息的时间和搜索结果依赖于用户输入的关键词的顺序,不仅操作繁琐,而且查找效率低下的问题。
本发明提供以下技术方案:
一种实现信息搜索的方法,包括如下步骤:
接收发布信息的用户输入的信息及对应的关键词;
对所述关键词进行分词处理获得一个新的词,并在信息库中建立该词的相关信息与所述用户输入的信息之间的关联关系;以及
在搜索信息时,对用户输入的关键词进行分词处理获得一个新的词,利用该词的相关信息与所述信息库中词的相关信息进行匹配,并将信息库中匹配成功的所述词的相关信息所关联的信息提供给用户。
其中,所述词的相关信息为该词本身;或者,所述词的相关信息为能够唯一标识该词的索引。
较佳的,所述对关键词进行分词处理获得一个新的词包括如下步骤:
对应于分词处理后获得的每一个词分别生成一个哈希Hash代码;
根据所述Hash代码将所述各词进行排序获得一个新的词。
其中,按照各词的Hash代码值的大小将所述各词由小到大进行排列获得一个新的词。
进一步,对排序后获得的新词生成一个Hash代码,并将该Hash代码作为该词的索引。
在信息库中建立词的索引与信息的关联关系时,先判断是否已存在相同的索引,并且在存在相同的索引时,直接将信息关联所述索引。
一种提供用户搜索的系统,包括:
信息库,用于存储发布信息的用户发布的信息以及该信息的关联信息;
信息处理装置,用于接收发布信息的用户输入的信息及对应的关键词,对该关键词进行分词处理获得一个新的词,以及在所述信息库中建立该词的相关信息与所述用户输入的信息之间的关联关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴公司,未经阿里巴巴公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610127662.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于AVS视频编码的快速帧间预测模式选择方法
- 下一篇:电压控制振荡器电路
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置