[发明专利]一种用户反馈引导的自适应对话推荐方法和系统有效
申请号: | 202110073633.5 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112883170B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 徐君;鲁宇婧;许珂瑞;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/042 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 冀志华 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 反馈 引导 自适应 对话 推荐 方法 系统 | ||
本发明涉及一种用户反馈引导的自适应对话推荐方法和系统,其特征在于包括以下步骤:1)获取日志数据,包括日志数据中收集的历史用户活动以及物品和属性之间的关系;2)基于获取的日志数据以及用户的在线反馈,构建反馈引导的偏好适应网络模型;其中,用户的在线反馈包括属性级反馈和物品级反馈;3)基于当前对话状态以及反馈引导的偏好适应网络模型与用户进行交互,交互内容包括选择询问某个属性或作出推荐,并基于用户的在线反馈确定对话结束或进入下一轮对话。本发明可以广泛应用对话推荐系统。
技术领域
本发明涉及一种用户反馈引导的自适应对话推荐方法和系统,属于对话推荐系统领域。
背景技术
在如今信息化的时代,推荐系统发挥着越来越重要的作用。传统的推荐系统大多通过离线历史数据来构建模型,而用户的偏好是多样的,易随时间变化,仅根据历史数据难以得知用户此时的确切意图。
对话推荐系统可以通过自然语言的方式与用户进行交互,快速捕获用户意图,并推荐合适的物品。具体来讲,对话推荐系统是通过与用户的多轮对话来获取用户的当前偏好。它不仅基于过去的用户物品交互历史,还通过收集用户的在线反馈,实现可靠地估计用户当前意图。
虽然对话推荐系统已有了一些研究成果,但在其模型设计方面仍存在一些不足。例如,对话推荐系统中现有的用户偏好模型通常将用户的在线反馈信息作为独立的特征或训练实例,这忽略了在多轮对话推荐系统场景下,细粒度的属性级反馈和粗粒度的物品级反馈之间的层次关系。用户拒绝推荐的某个物品的原因并非不喜欢该物品的所有属性,可能只是不喜欢其中的某些属性,但直接将用户反馈作为训练实例将降低与该物品关联的所有属性的得分。
发明内容
针对上述问题,本发明的目的是提供一种用户反馈引导的自适应对话推荐方法和系统,针对多轮对话推荐系统提出一种新的用户偏好预测模型,称为反馈引导的偏好自适应网络(FPAN)。在FPAN中,根据在线属性级别的反馈,设计了两个门控模块,分别用于修改用户的嵌入和物品级别的反馈。门控模块利用细粒度的属性级别反馈来修改粗粒度的物品级别反馈和用户嵌入,通过考虑层次关系来更精确地识别触发用户拒绝物品的原因,从而实现更准确的用户偏好预测,以提升推荐的成功率。
为实现上述目的,本发明采取以下技术方案:
本发明的第一个方面,是提供一种用户反馈引导的自适应对话推荐方法,其包括以下步骤:
1)获取日志数据,包括日志数据中收集的历史用户活动以及物品和属性之间的关系;
2)基于获取的日志数据以及用户的在线反馈,构建反馈引导的偏好适应网络模型;其中,用户的在线反馈包括属性级反馈和物品级反馈;
3)基于当前对话状态以及反馈引导的偏好适应网络模型与用户进行交互,交互内容包括选择询问某个属性或作出推荐,并基于用户的在线反馈确定对话结束或进入下一轮对话。
进一步,所述步骤2)中,构建反馈引导的偏好适应网络模型的方法,包括以下步骤:
2.1)基于日志数据中收集的历史用户活动以及物品和属性之间的关系,得到用户、物品和属性的嵌入表示;
2.2)基于步骤2.1)中用户、物品和属性的初始节点表示以及当前对话中的用户在线反馈信息进行自适应学习,得到不同的反馈信号;
2.3)对步骤2.2)中得到的不同的反馈信号进行聚合,得到用户偏好表示,将其分别与物品嵌入和属性嵌入进行点积,得到反馈引导的偏好适应网络模型;
2.4)确定损失函数,并对步骤2.3)中聚合得到的反馈引导的偏好适应网络模型进行训练,得到模型参数。
进一步,所述步骤2.1)中,用户、物品和属性的嵌入表示的获得方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110073633.5/2.html,转载请声明来源钻瓜专利网。