[发明专利]一种基于遗传算法的搜索方法及装置无效
申请号: | 201010592626.8 | 申请日: | 2010-12-16 |
公开(公告)号: | CN102043846A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 闫俊英;宁建红;熊玉梅 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 郑玮 |
地址: | 200240 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 遗传 算法 搜索 方法 装置 | ||
1.一种基于遗传算法的搜索方法,其特征在于,所述搜索方法包括:
步骤S1、依据用户浏览过的页面进行内容分析,根据信息主题对页面进行聚类,形成用户兴趣模型;
步骤S2、依据适应度均值选择适应度函数值最理想的个体,优化用户兴趣模型;
步骤S3、将搜索的页面集合进行队列,并依据相关度进行排序,优先搜索相关度高的网页。
2.根据权利要求1所述的搜索方法,其特征在于,在所述步骤一中,采用模糊C均值算法,在数据集的聚类数目已知的情况下,计算最佳的数据划分。
3.根据权利要求1所述的搜索方法,其特征在于,在所述步骤一中,依据用户的长期兴趣和短期兴趣进行分析。
4.根据权利要求1所述的搜索方法,其特征在于,在所述步骤一中,采用一个三元组(keyi,wi,f)来表示每一个兴趣节点,其中keyi表兴趣节点的关键词,wi表示该关键词的权重,f表示该兴趣的新鲜度。
5.根据权利要求1所述的搜索方法,其特征在于,在所述步骤二中,进一步包括如下步骤:
S21、随机产生size个长度为m的二进制串组成种群;
S22、种群进行以p概率进行交叉、以pc概率进行变异,产生下一代种群个体;
S23、计算个体p的适应度并判断适应度均值是否不再发生较大变化或当前的代数是否已经达到最大代数,若是则执行S24,否则转S22;
S24、选择适应度函数值最理想的个体。
6.根据权利要求1所述的搜索方法,其特征在于,在所述步骤三中,进一步包括:利用通用搜索引擎获得初始的网页集合,并放入待搜索的网页队列。
7.根据权利要求1所述的搜索方法,其特征在于,在所述步骤三中,进一步包括:对待搜索的网页队列,利用向量空间模型计算查询结果与用户兴趣的相关度,并按照相关度进行排序,优先搜索相关度高的网页。
8.一种基于遗传算法的搜索装置,其特征在于,所述搜索装置包括分析聚类模块、优化模块、列队及优先搜索模块。
9.根据权利要求8所述的搜索装置,其特征在于,所述分析聚类模块,用于依据用户浏览过的页面进行内容分析,根据信息主题对页面进行聚类,形成用户兴趣模型。
10.根据权利要求8所述的搜索装置,其特征在于,优化模块,用于依据适应度均值选择适应度函数值最理想的个体,优化用户兴趣模型。
11.根据权利要求8所述的搜索装置,其特征在于,列队及优先搜索模块,用于将搜索的页面集合进行队列,并依据相关度进行排序,优先搜索相关度高的网页。
12.根据权利要求10所述的搜索装置,其特征在于,进一步包含第一生成模块,随机产生size个长度为m的二进制串组成种群。
13.根据权利要求10所述的搜索装置,其特征在于,进一步包含第二生成模块,种群进行以p概率进行交叉、以pc概率进行变异,产生下一代种群个体。
14.根据权利要求10所述的搜索装置,其特征在于,进一步包含计算及判断模块,计算个体p的适应度并判断适应度均值是否不再发生较大变化或当前的代数是否已经达到最大代数。
15.根据权利要求10所述的搜索装置,其特征在于,进一步包含输出模块,选择适应度函数值最理想的个体,最终获得最优的用户兴趣模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010592626.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:链式链轮钩自动拉拔机
- 下一篇:一种互联网扩展广告的播放方法和扩展广告处理器