[发明专利]一种实现网站导航的方法和装置有效
申请号: | 201510591176.3 | 申请日: | 2012-10-16 |
公开(公告)号: | CN105117482B | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 彭仁刚;秦吉胜 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F16/954 | 分类号: | G06F16/954 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 网站 导航 方法 装置 | ||
1.一种实现网站导航的方法,包括:
对网站列表中的每个网站,生成该网站的描述信息,将该网站的描述信息作为训练数据输入概率潜在语义分析PLSA模型,启动PLSA模型的训练过程,获取该网站所属的话题分类数据;其中,所述网站列表包括至少一个网站;网站列表为导航网站可推荐的网站的集合;
综合所述网站列表中的每个网站所属的话题分类数据,得到每个话题分类数据所对应的网站;
生成客户端方访问者的描述信息,将该客户端方访问者的描述信息作为预测数据输入PLSA模型,启动PLSA模型的预测过程,获取该客户端方访问者倾向访问的话题分类数据;
根据该客户端方访问者倾向访问的话题分类数据和所述每个话题分类数据所对应的网站,确定该客户端方访问者倾向访问的目标网站,将客户端方访问者倾向访问的目标网站显示输出。
2.如权利要求1所述的方法,其中,在所述确定该客户端方访问者倾向访问的目标网站之后,并在所述将客户端方访问者倾向访问的目标网站显示输出之前,该方法进一步包括:
对该客户端方访问者倾向访问的每个网站,计算该网站的描述信息与该客户端方访问者的描述信息之间的相似度值;
根据计算出的相似度值,从该客户端方访问者倾向访问的每个话题分类数据所对应网站中选择一个或多个网站作为最终选择的目标网站;
则所述将客户端方访问者倾向访问的目标网站显示输出为:将最终选择的目标网站通过客户端的导航网页显示输出,其中,如果最终选择的目标网站为多个,则在客户端的导航网页中将该多个最终选择的目标网站按相似度值进行排序显示输出。
3.如权利要求2所述的方法,其中,所述根据计算出的相似度值,从该客户端方访问者倾向访问的每个话题分类数据所对应网站中选择一个或多个网站作为最终选择的目标网站包括:
从该客户端方访问者倾向访问的每个话题分类数据所对应网站中选择对应相似度值最大的一个网站或者按相似度值排序后选择排序在前的多个网站作为最终选择的目标网站。
4.如权利要求1至3中任一项所述的方法,其中,
所述对网站列表中的每个网站,生成该网站的描述信息包括:收集该网站的相关信息,对收集到的该网站的相关信息依次进行规则化处理、分词处理、过滤无意义词的处理、对剩余词统计词频的处理,得到该网站的描述信息;
所述生成客户端方访问者的描述信息包括:收集该客户端方访问者的相关信息,对收集到的该客户端方访问者的相关信息依次进行规则化处理、分词处理、过滤无意义词的处理、对剩余词统计词频的处理,得到该客户端方访问者的描述信息。
5.如权利要求4所述的方法,其中,
所述收集该网站的相关信息包括:收集该网站的网页的标题信息和收集指向该网站的网页的查询关键字信息;
所述收集该客户端方访问者的相关信息包括:收集该客户端方访问者所浏览网页的标题信息和收集该客户端方访问者搜索网页所使用的查询关键字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510591176.3/1.html,转载请声明来源钻瓜专利网。