[发明专利]一种基于搜索关键字的用户兴趣图序列动态管理方法在审
申请号: | 202010277273.6 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111488493A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 赵靓;冯铃;喻丰 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9535 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 何会侠 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 搜索 关键字 用户 兴趣 序列 动态 管理 方法 | ||
一种基于搜索关键字的用户兴趣图序列动态管理方法,步骤如下:1、收集用户关键字搜索历史,搜索关键字作为潜在兴趣;2、将搜索时的隐式交互行为映射为图序列模型;3、基于兴趣的延续性,通过后续用户搜索反向动态更新前序图序列,自适应过滤噪音搜索,保留真实用户兴趣。本发明设计完整的理论模型框架,原创性地对用户搜索及隐式交互行为建模,还原行为细节,从搜索行为中挖掘真实用户兴趣,保留高生态效度,并在真实数据上对模型进行验证。
技术领域
本发明涉及数据挖掘、计算机应用技术领域,具体涉及一种基于搜索关键字的用户兴趣图序列动态管理方法。
背景技术
用户兴趣挖掘分析对于理解用户意图、发现相似用户、提供个性化推荐等服务具有重要指导意义。目前为止,针对用户兴趣的建模与分析主要用于个性化商品推荐及广告投放中,现有技术以用户购买的具体商品或对该商品的显式打分作为兴趣,而非抽象化的用户对某类话题或商品的兴趣。
以购物为例,实际上,比起用户数据中仅占很小部分的购买行为,用户在网站中更为丰富的搜索、浏览行为轨迹能够最大程度地反映用户的各种购买兴趣,尤其是大量搜索数据中反映的搜索兴趣。然而,从繁杂的搜索、浏览数据中发现用户的兴趣并非易事,面临以下两大挑战:
挑战1:用户的行为数据是异构的,包括显式的搜索关键字、搜索时长、结果页面点击数目等。如何以结构化方式对这类多源异构信息进行组织、建模,还原行为细节,构建用户搜索兴趣模型,是一个基础性的挑战;
挑战2:由于用户行为的高度随机与不确定性,用户搜索目标初始时通常较为模糊,不断调整并提交新的关键字,随着搜索过程进行目标请求逐渐清晰准确;外部随机事件亦会影响用户的搜索路径,改变搜索目标。如何处理用户类似的搜索动态,有效过滤噪音搜索,找出用户真正兴趣是基于搜索关键字的用户兴趣建模、管理的最重要挑战。
目前,尚无相关技术从用户搜索轨迹及交互细节中挖掘相应用户兴趣。现有方法尚未能涉及上述研究挑战。综上,对于基于搜索关键字的用户兴趣建模问题,在应用研究上尚属空白,现有技术层面上也无法解决上述研究挑战。
发明内容
为了克服上述现有技术存在的问题,本发明的目的在于提供一种基于搜索关键字的用户兴趣图序列动态管理方法,首次综合用户丰富的搜索、浏览行为数据,以用户搜索兴趣为基础,设计了系统化完整的用户兴趣图序列动态管理框架。特别地,针对挑战1,本发明将以用户的显式搜索关键字作为潜在兴趣,以sigmoid函数将相应的隐式浏览行为映射为兴趣程度值,量化搜索之间的语义与时间关联,以独立的无向完全图对单个搜索区间进行建模,实现了以图序列为基础的兴趣建模;针对挑战2,本发明以守恒规则为灵感,进一步设计自适应的动态演化策略,反向更新前序图序列,过滤噪音搜索,甄别用户真实兴趣。
为了达到上述目的,本发明采取了以下技术方案予以实施:
一种基于搜索关键字的用户兴趣图序列动态管理方法,步骤如下:
步骤1:收集用户关键字搜索历史,经得用户知情授权情况下,通过爬虫抓取用户的搜索关键字以及隐式交互行为,包括搜索时长、搜索结果页面浏览数目以及结果页面平均浏览时长;
步骤2:以图序列模型对用户搜索行为静态建模,具体如下:
图序列模型由时间轴上排列的无向完全图组成,每个无向完全图G=(N,E,[Ts,Te])对应用户的一个搜索区间,若两个相邻的搜索间隔时间不超过30分钟,则同处一个搜索区间;其中,N为节点集合,每个节点对应该搜索区间中的一个搜索关键字,作为潜在用户兴趣;E为边集合,代表搜索区间中任意两节点之间的关联强度;[Ts,Te]表示该搜索区间的持续时间段,分别取搜索区间中第一个搜索的开始时间以及最晚结束的搜索的结束时间作为Ts和Te;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010277273.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种获取互联网金融广告的方法
- 下一篇:燃气锅炉网格在有限元分析中的设计方法