[发明专利]基于Agent的元搜索引擎个性化方法有效
申请号: | 201310514425.X | 申请日: | 2013-10-27 |
公开(公告)号: | CN103593413B | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 李青山;邹延鑫;孙颖成;许静静;习斌 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 agent 搜索引擎 个性化 方法 | ||
技术领域
本发明属于信息处理技术领域,更进一步涉及互联网信息检索领域和个性化服务领域中的基于Agent的元搜索引擎个性化方法。本发明可应用于元搜索引擎优化领域中有关满足用户个性化检索需求的一种方法。
背景技术
当前,面对互联网信息资源不断膨胀以及用户需求不断增加,为解决传统搜索引擎信息覆盖率低且不同搜索引擎检索结果重合率低、单一搜索引擎难以满足用户信息类查询需求等不足,提高用户的体验,能够集成多个搜索引擎的搜索结果并提供统一访问机制的元搜索引擎被提出。为解决元搜索引擎缺乏兴趣主动学习与信息推送能力等个性化服务,元搜索引擎个性化的相关技术被提出:通过分析用户的个性化检索意图,提供有针对性的检索服务;主动学习群组用户兴趣,推送用户感兴趣的信息。
西安电子科技大学申请的专利“基于用户兴趣的个性化元搜索引擎及搜索结果处理方法”(专利申请号:200910020951.4,公布号CN101477554A)公开了一种基于用户兴趣的个性化元搜索引擎及其搜索结果处理方法。该方法通过用户主动选择网站提供的兴趣类别并设置权值大小,或者对用户搜索行为进行兴趣分析,建立用户的兴趣数据模型,作为对后续搜索结果进行个性化排序的依据。该方法存在的不足是:用户需要手动设置或者进行多次检索行为,搜索引擎才可以记录、分析、获得用户兴趣,缺少对用户使用搜索引擎之前浏览记录的挖掘;没有根据用户兴趣划分用户群组,不能更好地为具有共同兴趣的用户提供贴切的推荐信息。
中兴通讯股份有限公司申请的专利“一种个性化元搜索的方法及其应用终端”(专利申请号:201010200736.5,公布号CN101853308A)公开了一种个性化元搜索的方法。该方法通过预先建立兴趣库,根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理,利用使用日志,对与处理后的搜索结果和兴趣库中对应所述被搜索的关键词的资源定位符的兴趣度进行计算,根据计算结果排序并显示。该方法存在的不足是:通过资源定位符来表达兴趣,但是由于网络的不确定性导致资源定位符可能会失效,因而其并不适于表示用户兴趣;没有根据用户兴趣划分用户群组,不能更好地为具有共同兴趣的用户提供贴切的推荐信息。
发明内容
本发明的目的在于克服上述已有技术的不足,提出一种基于Agent的元搜索引擎个性化方法,通过对用户分组,在检索结果中为用户提供相同兴趣组内用户推荐的链接和兴趣词,为用户提供个性化的检索服务。
本发明的具体思路是:通过移动Agent提取用户有效浏览记录,挖掘有效浏览记录初始化用户兴趣模型,通过公共兴趣黑板中对具有相同兴趣用户的划分实现用户分组,统计分组内的推荐兴趣词和推荐链接,在用户进行检索时将对应分组的推荐兴趣词和对应用户检索词的推荐链接在检索结果中展示给用户,从而实现对用户的个性化检索服务。
为实现上述目的,本发明的具体步骤包括如下:
(1)判断用户是否首次使用元搜索引擎,若是,转至步骤(2),否则转至步骤(6)。
(2)挖掘用户浏览记录:
2a)将移动Agent通过路由策略移动至用户客户端;
2b)利用移动Agent过滤用户浏览记录得到有效浏览记录,并将该记录发送回服务器端。
(3)初始化用户兴趣模型:
3a)服务器端的个性化Agent接收移动Agent发送的用户浏览记录;
3b)个性化Agent对有效浏览记录进行挖掘,利用分词工具对用户浏览的文本分词,得到文本中出现的词条及频度,将文本中出现频度大于等于5次的词条作为用户兴趣词,利用朴素贝叶斯公式计算得到文本类别;
3c)将步骤3b)中得到的兴趣词对应频度的归一化值作为兴趣词的权重,将兴趣词所属文本的类别作为兴趣词的类别,按条依次得到多个由兴趣词、权重、类别组成的三元组,将每个三元组作为一条用户兴趣向量添加到用户兴趣模型中;
3d)判断用户兴趣模型所包含的用户兴趣向量数目是否超过阈值,若是,比较用户兴趣模型中全部用户兴趣向量的权重,将最低权重对应的用户兴趣向量删除,否则转至步骤3c)。
(4)划分用户群组:
4a)个性化Agent将用户兴趣模型中现存用户兴趣向量发布至公共兴趣黑板;
4b)公共兴趣黑板按照用户兴趣向量中兴趣词的类别,将具有同类兴趣词的用户划分为同一分组。
(5)获取群组兴趣:
5a)提取公共兴趣黑板中每个分组内用户发布的用户兴趣向量中的兴趣词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310514425.X/2.html,转载请声明来源钻瓜专利网。