[发明专利]一种基于搜索历史、浏览足迹的搜索推荐方法在审
申请号: | 202011074519.6 | 申请日: | 2020-10-09 |
公开(公告)号: | CN112163158A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 冯光璐;欧阳静;李然;黄莉雅;曾路;舒彧;倪凡 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06F16/335;G06F16/338;G06F16/33;G06F16/35;G06K9/62 |
代理公司: | 成都玖和知识产权代理事务所(普通合伙) 51238 | 代理人: | 胡琳梅 |
地址: | 550000 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 搜索 历史 浏览 足迹 推荐 方法 | ||
1.一种基于搜索历史、浏览足迹的搜索推荐方法,其特征在于:所述方法包括以下步骤:
步骤S1:建立文档相似度关系,在处理大量文档的过程中,计算文档相似度,梳理文档相似度关系;
步骤S2:根据设定的用户标签,再从用户标签中提取前N个最活跃的标签,根据这些标签到文档库中进行全文搜索,对搜索到的文档进行排序,匹配标签越多权重越高;
步骤S3:根据用户的浏览足迹,取出最新的M条记录,根据这M条记录在数据库中查找文档的相似文档,相似度越高排名越靠前;
步骤S4:从用户标签中推荐的文档和从浏览足迹中找到的相似文档,对这些文档进行合并,去掉重复记录,去掉用户已经浏览过的记录,最终做加权排序再推荐给用户。
2.根据权利要求1所述的一种基于搜索历史、浏览足迹的搜索推荐方法,其特征在于:所述步骤S1中,使用simHash算法计算文档相似度。
3.根据权利要求2所述的一种基于搜索历史、浏览足迹的搜索推荐方法,其特征在于:步骤S1包括的具体步骤如下:
步骤S11:计算文档的simHash值;
步骤S12:比较文档的simHash值相似度,如果大于阈值则保存文档相似记录,然后进入下一步;如果小于阈值则直接进入下一步;
步骤S13:保存文档信息,结束。
4.根据权利要求1所述的一种基于搜索历史、浏览足迹的搜索推荐方法,其特征在于:所述N值为20、30、40或50。
5.根据权利要求1所述的一种基于搜索历史、浏览足迹的搜索推荐方法,其特征在于:所述M值为20、30、40或50。
6.根据权利要求1所述的一种基于搜索历史、浏览足迹的搜索推荐方法,其特征在于:所诉步骤S2中,用户标签通过用户的搜索记录智能提取或直接由用户手动添加自己的关键词,通过用户的搜索记录智能提取是根据用户的搜索记录使用nlp分词、去掉停用词及标点符号,最后提取出用户搜索的关键词,以此关键词作为用户标签。
7.一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述的方法。
8.一种计算机可读存储介质,其上储存有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的方法。。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011074519.6/1.html,转载请声明来源钻瓜专利网。