[发明专利]基于知识网络的搜索结果聚焦系统及聚焦方法在审
申请号: | 201210518553.7 | 申请日: | 2012-12-05 |
公开(公告)号: | CN103020206A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 王树强;宋传宝;庞晓曦 | 申请(专利权)人: | 北京海量融通软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;董烨飞 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 网络 搜索 结果 聚焦 系统 方法 | ||
技术领域
本发明涉及一种搜索结果聚焦系统及聚焦方法,尤其涉及一种利用预定领域的知识网络作为聚焦依据,从而改善搜索结果聚焦效果的聚焦系统及聚焦方法,属于网络搜索技术领域。
背景技术
当前,互联网中的数据总量以几百兆兆字节来计算,而且仍然呈指数增长。为了帮助用户从这个漫无边际的数据海洋中快速获取所需的信息,搜索引擎发挥着不可替代的作用。互联网信息是极其浩繁的,任何一个关键词都可能搜索到数百个甚至数万个相关的网页或者链接。而通过通用搜索引擎得到的搜索结果往往精度低,难以迅速让用户得到所需内容。因此,有必要对搜索结果进行聚焦分类,重新整理分类排序,使得用户能够迅速锁定目标集合。
在这一技术领域,目前通用的方法是利用搜索结果聚类,根据某些用户未知的条件将搜索结果聚类到若干子集中,并提供子集标签以利于用户迅速锁定。例如申请号为200410091772.7的中国专利申请中,公开了一种搜索结果聚类的方法,包括如下步骤:预先记录被索引文档相对于其所包含的某个或者某几个关键词的一个或多个类别;根据预先记录的文档相对于包含在搜索请求中的某个或者某几个关键词的类别,对所述搜索结果中的文档分组。所述类别可以为任意的文档分类标记或者关键词。每个类别可设置一个权重值。搜索结果中的文档被放入该文档相对于查询关键词的类别集合中,并且所得到的各个聚类类别的级别可由其所包含的文档的级别来计算。该聚类方法适用于大规模文档检索系统(例如互联网搜索引擎)对搜索结果的聚类,并且通过对聚类类别评级,可以将具有较高级别的聚类以及其中较高级别的文档优先呈现给用户。
美国雅虎公司在申请号为200780049318.7的中国专利申请中,也提出了一种用于搜索数据并且将搜索结果分组成根据搜索相关性来排序的聚类的方法和装置。每个聚类包括一个或多个数据类型,诸如图像、WEB页面、本地信息、新闻、广告等。在一个实施例中,针对指示搜索的数据源的分类的相关概念来评价搜索项。还可通过诸如客户端设备的位置、当前运行的应用等上下文信息来识别数据源。每个聚类中的搜索结果通过相关性来排序,并且每个聚类都基于该聚类之内的相关性的聚集而被给予分数。每个聚类分数可基于一个或多个相应概念和/或上下文信息来修改。基于经修改的分数来排序聚类。包括广告的内容还可被增加到经排序的列表以表现为另一聚类。
另外,在专利号为ZL 200810226637.7的中国发明专利中,进一步提出了一种优化聚类搜索结果的方法及其装置,用以解决现有聚类搜索技术返回的搜索结果不能满足用户的个性化搜索需求的问题。具体技术方案包括:根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与所述聚类类别对应的历史权值;根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值;根据所述结果权值,确定所述聚类类别返回给用户时的优先级。通过该技术方案返回的聚类搜索结果能够满足用户的个性化搜索需求,提高用户的体验度。
由于聚类技术所存在的局限性,导致现有的通用搜索引擎所提供的搜索结果数据量大、精度低。用户不得不进行人工二次搜索,工作效率低下。
发明内容
本发明所要解决的技术问题在于提供一种基于知识网络的搜索结果聚焦系统及聚焦方法。该技术方案利用预定领域的知识网络作为聚焦依据,可以有效改善搜索结果的聚焦效果。
为实现上述的发明目的,本发明采用下述的技术方案:
一种基于知识网络的搜索结果聚焦系统,包括知识网络库、搜索结果模块、模式引擎和聚焦呈现模块,其中所述模型引擎分别连接所述搜索结果模块、所述知识网络库和所述聚焦呈现模块;
所述搜索结果模块将通用搜索引擎的搜索结果输入所述模式引擎中,所述模式引擎从所述知识网络库的根节点开始,依据知识网络节点中的模式判别函数对所述搜索结果进行模式判别归类,完成所述搜索结果的聚焦工作;
所述聚焦呈现模块将聚焦后的所述搜索结果输出显示。
其中较优地,所述搜索结果聚焦系统中还包括辅助概念树,所述辅助概念树与所述知识网络库连接。
其中较优地,所述知识网络库由多个知识网络节点构成,每个知识网络节点具有自身专属的模式判别函数和概念标签。
其中较优地,所述知识网络库中的多个知识网络节点采用树状层次结构分布方式。
一种基于知识网络的搜索结果聚焦方法,基于上述的搜索结果聚焦系统实现,包括如下步骤:
首先通过用户输入,引发通用搜索引擎的搜索结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海量融通软件技术有限公司,未经北京海量融通软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210518553.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方向盘骨架成型压机
- 下一篇:一种石墨结晶器