[发明专利]一种基于内容可信的Web搜索引擎系统及搜索方法有效
申请号: | 201310564892.3 | 申请日: | 2013-11-14 |
公开(公告)号: | CN103646034B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 徐洪珍;许杰云;于臻;汤彬 | 申请(专利权)人: | 东华理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南昌新天下专利商标代理有限公司36115 | 代理人: | 施秀瑾 |
地址: | 344000 江西省抚州市府路*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 内容 可信 web 搜索引擎 系统 搜索 方法 | ||
1.一种基于内容可信的Web搜索引擎系统,其特征在于它包括:
(1) Web用户接口模块,接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低显示最终的搜索结果;
(2) 搜索请求处理模块,将Web用户的搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页;
(3) 查询结果去重模块,对上所述搜索引擎以及查询结果存储数据库返回的搜索结果进行去重处理;
(4) 内容可信度计算模块,根据内容可信的5个因素,对去重后的搜索结果进行内容可信度计算;
(5) 查询结果重排序模块,将上述具有内容可信度的查询结果,根据可信度的高低,按照降序重新进行排序;
(6) 查询结果存储数据库,存储具有内容可信度的查询结果。
2.根据权利要求1所述的一种基于内容可信的Web搜索引擎系统,其特征在于各模块之间的连接关系如下:
(1) Web用户接口模块,与搜索请求处理模块和查询结果重排序模块相连接,负责接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低,将查询结果重排序模块的最终可信搜索结果显示给用户;
(2) 搜索请求处理模块,与Web用户接口模块、查询结果存储数据库和查询结果去重模块相连接,负责将Web用户接口模块传来的用户搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页,同时将这些搜索结果传送给查询结果去重模块;
(3) 查询结果去重模块,与搜索请求处理模块和内容可信度计算模块相连接,负责将搜索请求处理模块传来的传统搜索结果进行去重处理,并将去重后的搜索结果传送给内容可信度计算模块;
(4) 内容可信度计算模块,与查询结果去重模块、查询结果存储数据库和查询结果重排序模块相连接,对查询结果去重模块传来的去重后的搜索结果,根据内容可信的5个因素进行内容可信度计算,并将带有内容可信度的搜索结果分发给查询结果存储数据库和查询结果重排序模块相;
(5) 查询结果重排序模块,与内容可信度计算模块和Web用户接口模块相连接,负责将内容可信度计算模块传来的具有内容可信度的搜索结果,根据可信度的高低,按照降序重新进行排序,并将排序后的搜索结果传送给Web用户接口模块;
(6) 查询结果存储数据库,与搜索请求处理模块和内容可信度计算模块相连接,接收搜索请求处理模块传来的搜索请求,并返回相应的搜索结果,同时存储经过处理后的具有内容可信度的搜索结果。
3.根据权利要求1或2所述的一种基于内容可信的Web搜索引擎系统,其特征在于内容可信度计算如下:对任一返回的Web网页p,根据内容可信的5个因素,即网页内容的相关性Rev、权威性Auth、外部链接数BN、时间Age和点击率CliR,其内容可信度计算为:
其中,网页内容相关性的计算为:对任一搜索请求q,p为返回的某一Web网页,则p和q的相关性计算如下,其中T(p)表示p的主题词集,N(q)表示q中关键词的个数,表示q和T(p)重叠的个数;
网页点击率的计算为:对任一用户搜索请求q,pi为返回的某一Web网页,则pi的点击率计算如下,其中Hi表示pi被用户点击的次数;
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学,未经东华理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310564892.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高硬度保护壳及其制备方法
- 下一篇:保护β-胡萝卜素的组合物
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法