[发明专利]搜索方法及搜索系统在审
申请号: | 201110278405.8 | 申请日: | 2011-09-20 |
公开(公告)号: | CN103020049A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 杨震;俞惠华;陈正文;沈利锷 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 屠长存 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 方法 系统 | ||
技术领域
本发明涉及互联网领域,尤其涉及一种搜索方法和一种搜索系统。
背景技术
搜索引擎技术是随着互联网技术的发展而不断发展完善的,其作用是根据用户输入的请求关键词对海量信息进行搜索,帮助用户获取目标信息。
现有的搜索流程通常包括:根据用户提供的请求关键词进行分词等计算,返回一个与请求关键词相关的信息列表供用户筛选。
本发明的发明人对以上方法进行了深入研究,发现存在以下问题:
第一、现有搜索方法的搜索难度大,耗费用户的搜索时间较长。由于这种搜索方法根据用户的请求关键词提供一个信息列表,而信息列表的内容繁多,需要用户在筛选信息列表的过程中逐步理解搜索引擎的使用方法,理解关键词输入的技巧,通过调整请求关键词重新表达信息需求,增加了用户的搜索时间和搜索难度。
第二、当用户输入的请求关键词不准确时,难以为用户快速提供目标信息。例如,用户的目标信息是有关“长城饭店”的信息,但用户误将请求关键词输入为“长城饭馆”。由于现有的搜索方法是对请求关键词进行分词处理,即将请求关键词“长城饭馆”拆分为“长城”和“饭馆”,并提供每个词的相关信息列表。因此,即使分词准确,也会产生有关“长城”和“饭馆”的大量信息,使得用户难以在众多信息中发现“长城饭店”的信息。而分词错误所产生的干扰信息更多。虽然经过改良的搜索方法通过同义词、近义词处理能得到部分相关结果,但系统开发和维护量大,搜索计算的规则复杂。
发明内容
本发明的发明人发现上述现有技术中存在搜索难度大、用户搜索耗时长等问题,并因此针对所述问题中的至少一个问题提出了一种新的技术方案。
本发明的一个目的是提供一种搜索方法和搜索系统,用于为用户提高方便快速的搜索服务。本发明的另一个目的是把后台与用户搜索行为相关的业务数据或信息,通过特征提取和相关度计算的方法,在用户输入相似关键词时,第一时间反馈到用户搜索界面。
根据本发明的第一方面,提供了一种搜索方法,包括:
S101.接收用户输入的请求关键词;
S102.根据所述请求关键词从服务特征库中提取相关的特征关键词,并提供给用户以供用户选择;
S103.响应于用户对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所提取的信息提供给用户。
优选地,步骤S102包括:计算所述请求关键词与所述服务特征库中的特征关键词的关联度;判断所述关联度是否高于关联阈值,将高于关联阈值的特征关键词从服务特征库中提取。
优选地,所述关联度的计算是计算所述请求关键词和所述特征关键词的字符相似度和/或语意相似度。
优选地,步骤S103还包括计算所述特征关键词与信息的相关度。
优选地,所述特征关键词与信息的相关度的计算包括:
根据语意计算模型计算所述特征关键词与信息的第一相关度;
根据信息日志记录,计算所述特征关键词与信息的第二相关度;
根据所述特征关键词与信息的第一相关度和第二相关度计算出综合相关度。
优选地,所述从信息数据库中提取与所述特征关键词相对应的信息是根据所述特征关键词与信息的相关度进行的。
优选地,在步骤S102中,所述特征关键词为针对全部类别或者至少一个类别的特征关键词。
优选地,所述类别包括业务数据类别、用户信息需求数据类别(例如,可以是用户需求个性特征类别)、用户环境数据类别、用户信息需求时间数据类别和服务数据类别。
优选地,所述搜索方法还包括展现所述特征关键词的对应信息的内容摘要。
本发明还提供一种搜索系统,包括:
搜索请求接收单元,用于接收用户输入的请求关键词;
服务特征库,用于存储特征关键词;
特征关键词提取单元,用于根据所述请求关键词从服务特征库中提取特征关键词,并提供给用户以供用户选择;
信息提取单元,用于响应于用户对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所提取的信息提供给用户。
优选地,所述特征关键词提取单元包括:
关联度计算模块,用于计算所述请求关键词与所述服务特征库中的特征关键词的关联度;
关联度判断模块,用于判断所述关联度是否高于关联阈值;
特征关键词提取模块,用于从服务特征库中提取高于关联阈值的特征关键词。
优选地,所述关联度计算模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110278405.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模糊查询方法及系统
- 下一篇:信号转接控制方法及信号转接装置