[发明专利]一种时间信息增强的个性化搜索方法有效
申请号: | 202011049004.0 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112182387B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 窦志成;马正一 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06N3/049;G06N3/0442;G06N3/084 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 信息 增强 个性化 搜索 方法 | ||
本发明通过人工智能领域的方法,实现了一种时间信息增强的个性化搜索方法,在输入用户集合基础上,通过循环神经网络得到的原始相关性得分,设计两个时间感知的LSTM结构得到用户的查询意图与文档兴趣的表示为用户的短期兴趣,并利用一个基于查询的以时间为自变量的高斯混合分布,得到为用户的长期查询意图与长期文档兴趣,进而通过个性化排序模块,最终利用神经网络模型同时考虑所述原始相关性得分和所述个性化得分对文档的个性化得分进行最终的计算。通过上述手段,本发明在连续时间空间内对用户兴趣进行建模,从而构建更加准确的用户兴趣表示进而提升个性化排序效果。
技术领域
本发明涉及人工智能领域,尤其涉及一种时间信息增强的个性化搜索方法。
背景技术
个性化搜索是各大搜索引擎的主要目标之一,现在主流的个性化算法是基于文本分析的方法,即建立用户兴趣模型,而后比较用户兴趣与候选文档的相似度来对结果进行重排。建立用户模型的主要依据是用户的历史点击行为,从而刻画出用户的兴趣特征,以此来完成个性化文档排序。个性化搜索的主要目标是根据用户兴趣不同,为不同用户返回满足其需要的个性化的排序列表。现有技术的基本思想是,首先利用用户历史对用户兴趣进行建模,进而在文档排序时,同时考虑文档和查询的相关性以及文档和用户兴趣的相似度。用户提出一个查询,搜索引擎会对候选文档进行打分,通过一定的方法对查询词和用户兴趣这两方面的因素进行融合获得最终得分。个性化搜索算法中,用户兴趣的表示和建模方法多种多样,但其主要思路都是基于用户历史搜索行为(包括用户提出的查询、查询上点击的行为、驻留时间等)来进行用户兴趣模型和个性化排序。例如,现有技术包括基于用户对文档的历史点击次数和点击文档的主题分布来进行个性化排序的方法。如果用户在查询某个查询时经常点击某个文档,则下一次用户再次查询该文档时,这个文档的排序位置将被提前。现有技术还利用了用户查询历史、页面浏览历史、点击驻留时间等多个因素对用户兴趣进行了更为细致的建模,在对结果的个性化重排上取得了很好的效果。还有一些技术通过提取用户查询和点击页面的主题来刻画用户兴趣特征,进而来评估文档与用户兴趣的相似性。深度学习的出现,使得模型对用户查询的语义理解能力得到提升,现有技术使用循环神经网络、对抗生成网络等来建立用户兴趣模型。
在现有的个性化搜索技术中,基于深度学习的序列模型在各数据集上取得了最佳的效果。这类模型往往基于一些成熟的序列神经网络,如循环神经网络(RNN)及其变种GRU,LSTM等。但是,这类模型往往在建模用户兴趣画像时忽略了用户行为之间连续时间信息,例如用户每次查询之间的时间间隔,而只利用了用户行为之间的顺序信息进行序列建模。事实上,用户的历史行为之间细粒度的连续时间间隔对刻画一个更加精准的用户画像是很有意义的。举例来说,如果一个用户在搜索引擎上搜索一个查询qa之后30天再搜索另一个查询qb,那么有理由认为qa和qb之间的关联应该不大,因为30天对于一般使用搜索引擎的用户来说属于较大的一个时间间隔了。相反。如果用户的两个查询之间只相隔了5分钟,那么有理由认为这两个查询之间可能会有较高的关联性。因此,用户在短期时间内的的搜索行为是对搜索之间的时间信息高度敏感的,然而遗憾的是,传统的RNN及其变种GRU,LSTM并不能很好的对用户行为之间的时间间隔进行建模。如果能够设计一种算法,将用户行为之间的时间信息融合到序列建模中,势必能够提升模型效果。
同时,除了在短时间内的时间敏感性,用户的往往在长时间内表现出一些重复查询的倾向,即用户经常试图去寻找一些他们之前曾经查询或浏览过的信息。有很多前人的工作试图利用用户的重复查询行为来提升个性化搜索模型效果,但是他们也没有考虑用户搜索行为之间的时间信息。举例来说,一些用户可能每年都会查询一些学术会议的官方网站,这个搜索行为体现了一种周期性的特点,而周期性是和时间信息高度敏感的。因此,用户长期时间内体现出的重查询行为同样会体现出时间敏感的特点,而先前的个性化搜索工作并没有考虑这一点。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011049004.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双风管变频移动空调
- 下一篇:译码方法和装置、终端、芯片及存储介质
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置