[发明专利]一种基于内容可信的Web搜索引擎系统及搜索方法有效

专利信息
申请号: 201310564892.3 申请日: 2013-11-14
公开(公告)号: CN103646034B 公开(公告)日: 2017-03-08
发明(设计)人: 徐洪珍;许杰云;于臻;汤彬 申请(专利权)人: 东华理工大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南昌新天下专利商标代理有限公司36115 代理人: 施秀瑾
地址: 344000 江西省抚州市府路*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于内容可信的Web搜索引擎系统及搜索方法,其特征在于它包括Web用户接口模块;搜索请求处理模块;查询结果去重模块;内容可信度计算模块,根据内容可信的5个因素,对去重后的搜索结果进行内容可信度计算;查询结果重排序模块;查询结果存储数据库,存储具有内容可信度的查询结果。本发明为基于内容可信的搜索引擎及搜索方法,不仅实现了web搜索网页的内容可信因素的量化和内容可信度的计算,还提供了基于可信度高低的Web搜索网页的重排序。与传统搜索引擎及搜索方法相比,本发明可以提供更为准确和更加可信的搜索结果。
搜索关键词: 一种 基于 内容 可信 web 搜索引擎 系统 搜索 方法
【主权项】:
一种基于内容可信的Web搜索引擎系统,其特征在于它包括:(1)Web用户接口模块,接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低显示最终的搜索结果;(2)搜索请求处理模块,将Web用户的搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页;(3)查询结果去重模块,对上所述搜索引擎以及查询结果存储数据库返回的搜索结果进行去重处理;(4)内容可信度计算模块,根据内容可信的5个因素,对去重后的搜索结果进行内容可信度计算;(5)查询结果重排序模块,将上述具有内容可信度的查询结果,根据可信度的高低,按照降序重新进行排序;(6)查询结果存储数据库,存储具有内容可信度的查询结果;各模块之间的连接关系如下:(1)Web用户接口模块,与搜索请求处理模块和查询结果重排序模块相连接,负责接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低,将查询结果重排序模块的最终可信搜索结果显示给用户;(2)搜索请求处理模块,与Web用户接口模块、查询结果存储数据库和查询结果去重模块相连接,负责将Web用户接口模块传来的用户搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页,同时将这些搜索结果传送给查询结果去重模块;(3)查询结果去重模块,与搜索请求处理模块和内容可信度计算模块相连接,负责将搜索请求处理模块传来的传统搜索结果进行去重处理,并将去重后的搜索结果传送给内容可信度计算模块;(4)内容可信度计算模块,与查询结果去重模块、查询结果存储数据库和查询结果重排序模块相连接,对查询结果去重模块传来的去重后的搜索结果,根据内容可信的5个因素进行内容可信度计算,并将带有内容可信度的搜索结果分发给查询结果存储数据库和查询结果重排序模块相;(5)查询结果重排序模块,与内容可信度计算模块和Web用户接口模块相连接,负责将内容可信度计算模块传来的具有内容可信度的搜索结果,根据可信度的高低,按照降序重新进行排序,并将排序后的搜索结果传送给Web用户接口模块;(6)查询结果存储数据库,与搜索请求处理模块和内容可信度计算模块相连接,接收搜索请求处理模块传来的搜索请求,并返回相应的搜索结果,同时存储经过处理后的具有内容可信度的搜索结果;所述内容可信度计算如下:对任一返回的Web网页p,根据内容可信的5个因素,即网页内容的相关性Rev、权威性Auth、外部链接数BN、时间Age和点击率CliR,其内容可信度计算为:0.2*Rev(p)+0.2*Auth(p)+0.2*BN(p)+0.2*Age(p)+0.2*CliR(p)Rev(p)+Auth(p)+BN(p)+Age(p)+CliR(p)]]>其中,网页内容相关性的计算为:对任一搜索请求q,p为返回的某一Web网页,则p和q的相关性计算如下,其中T(p)表示p的主题词集,N(q)表示q中关键词的个数,N(q∧T(p))表示q和T(p)重叠的个数;网页点击率的计算为:对任一用户搜索请求q,pi为返回的某一Web网页,则pi的点击率计算如下,其中Hi表示pi被用户点击的次数;
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学,未经东华理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310564892.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top