[发明专利]基于关键字分类并有多种呈现方式的搜索引擎装置与方法有效
申请号: | 201310229058.9 | 申请日: | 2013-06-08 |
公开(公告)号: | CN103294815B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 林荣恒;赵耀;邹华;吕文博;杨放春 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司11018 | 代理人: | 夏宪富 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于关键字分类并有多样化呈现的搜索引擎装置和方法,该装置设有四个组成部件用户交互界面、关键字处理单元、搜索单元和搜索结果呈现单元,其搜索方法是先对用户输入的关键字进行预处理和分类,再根据关键字的分类结果,选择多样化的不同呈现方式;并将搜索结果进行聚类后,填入所选定的呈现模板,使用相应的呈现方式将最终搜索结果向用户展示。本发明装置结构简单,操作容易;其呈现方式(突出关键字的不同分类)有利于用户的理解和使用,并使得搜索结果更简明、清晰。用户只需继续点击,就能进入与其搜索目标内容更相关的主题。有利于用户快速定位需求信息,节省用户自行筛选所需信息的时间,提升搜索效率和呈现效果。 | ||
搜索关键词: | 基于 关键字 分类 多种 呈现 方式 搜索引擎 装置 方法 | ||
【主权项】:
一种基于关键字分类进行搜索、并使搜索结果具有多样化呈现方式的搜索引擎装置,其特征在于:该装置设有四个组成部件:用户交互界面、关键字处理单元、搜索单元和搜索结果呈现单元,其中:用户交互界面,用于以Web浏览器方式与用户进行人机交互,交互界面设有搜索框、搜索按钮和搜索结果列表,以供用户在搜索时,先在搜索框中输入关键字并触发搜索按钮后,启动该装置执行搜索操作,在该交互界面上的搜索结果列表中显示搜索结果;关键字处理单元,用于接收从用户交互界面传递来的关键字,对关键字进行预处理后,将处理结果送到搜索单元;同时对预处理后的关键字利用事先建立的分类模型进行分类,再将该关键字分类结果转发给搜索结果呈现单元;设有:顺序连接的关键字预处理模块和由关键字特征选择、关键字分类和分类模型三个构件组成的关键字分类模块;所述关键字分类模块中的三个组成构件的功能分别是:关键字特征选择构件,负责对预处理后的关键字特征集合进行筛选,删除部分信息含量低、不具有类别意义的词,以便在减少特征数量的同时,减小特征向量维度;利用所选择的特征选择方法分别计算各个特征权重或评估分数,以此作为筛选依据,得到的筛选后的结果被称为特征子集;所述特征选择方法是采用有监督的特征选择方法、即利用已知类别的训练样本,通过若干个评估函数来统计特征与类别之间的相互关系,再根据统计结果决定特征的取舍;关键字分类构件,用于根据关键字特征选择构件筛选出的特征子集,利用分类模型构件对未知类别的扩展文本、即关键字进行分类,也就是根据特征子集重新计算得到未分类扩展文本的特征向量,再根据这些特征向量得到关键字的分类结果,并将分类结果同时发送给分类模型构件和搜索结果呈现单元;分类模型构件,负责在系统运行前期完成对关键字分类模型的建模,通过关键字训练集完成初始学习过程,形成初始分类模型;在系统运行阶段,该分类模型能够通过关键字分类构件对关键字的分类结果进行动态更新;该分类模型构件通过基于K最近邻的分类方法获得分类模型;搜索单元,用于对接收到的经过预处理的关键字采用独立搜索引擎进行搜索,并对搜索结果进行聚类分析,且在聚类分析时存储搜索结果的时间戳,该时间戳用于完成与时间相关的呈现内容;然后,将经过聚类处理后的搜索结果发送给搜索结果呈现单元;搜索结果呈现单元,为每个关键字分类都设置有相应的呈现模板,以供根据来自关键字处理单元的分类结果确定相应的呈现模板,再将搜索单元的搜索结果加入到该呈现模板中的相应位置,最后将该呈现模板中呈现的搜索单元的搜索结果信息通过用户交互界面向用户显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310229058.9/,转载请声明来源钻瓜专利网。