[发明专利]一种融合从众性建模的去偏新闻推荐方法在审
申请号: | 202310455876.4 | 申请日: | 2023-04-25 |
公开(公告)号: | CN116578776A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张琨;鲍纪敏;吴乐;汪萌 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F18/25;G06F18/214;G06Q10/04 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 从众 建模 新闻 推荐 方法 | ||
本发明公开了一种融合从众性建模的去偏新闻推荐方法,其步骤包括:1、分析新闻推荐中决定用户点击行为的因素,基于观测到的现象构建因果图;2、基于构建的因果图建立融合新闻流行度和用户的从众性特质建模的去偏新闻推荐模型;3、利用新闻数据集构建更具挑战性的去偏新闻推荐数据集,并采用负采样方法训练建立的模型;4、利用建立好的去偏新闻推荐模型实现用户对新闻的点击率预估任务。本发明能够更加关注用户点击行为背后的复杂因素,从而能实现更高质量的去偏新闻推荐。
技术领域
本发明涉及新闻推荐领域,具体说是一种全新的融合从众性建模的去偏新闻推荐方法。
背景技术
个性化新闻推荐技术能够帮助用户从纷繁复杂的新闻中找到用户感兴趣的新闻,对提升新闻网站的服务水平以及用户的阅读体验都有着极其重要的意义,其关键在于学习准确的新闻和用户表征。有大量的研究工作主要从用户的新闻历史点击记录中挖掘用户偏好,实现准确的用户偏好和新闻推荐。
传统的新闻推荐方法基于人工特征工程来学习新闻和用户表征,但这些方法需要大量的先验知识,没有考虑到新闻的上下文和顺序信息,近些年来深度学习的方法应用到新闻推荐中,卷积神经网络、循环神经网络、注意力机制等技术广泛用于提取新闻中丰富的语义表示和从用户历史点击记录中建模用户偏好,这些方法在一定程度上提升了新闻推荐的准确性。
现有的新闻推荐方法仍然存在对有偏信息过度依赖的问题。为了缓解在新闻推荐过程中对有偏信息的依赖,各类去偏的方法被提出来,如解耦表征学习,对抗学习等。融合因果推断方法实现无偏推荐是一个非常有潜力的研究方向。通过利用因果推断技术区分出观测数据中的虚假关联,模型能够更关注反映用户偏好的真实原因,从而实现无偏推荐。
尽管这些方法已经取得了显著的效果,然而用户的新闻点击行为是一系列复杂认知行为相互影响之后的决策结果,现有去偏方法仅关注了单方面因素(例如新闻流行度),未对隐藏在点击行为背后的复杂认知因素进行准确分析。在用户偏好建模以及无偏新闻推荐过程中,用户自身的认知特点也是一个重要的影响因素,需要引起足够的重视。同时如何基于用户历史点击数据实现用户认知特点分析以及用户偏好的准确建模也是一个充满挑战性的问题。
发明内容
本发明为解决现有技术的不足,提出了一种融合从众性建模的去偏新闻推荐方法,以期能更加关注用户点击行为背后的复杂因素,从而能实现更高质量的去偏新闻推荐。
本发明为了达到上述发明目的,采用如下技术方案:
本发明一种融合从众性建模的去偏新闻推荐方法的特点是按如下步骤进行:
步骤1、获取用户历史交互新闻数据集Q,并将其中任一用户u的历史点击新闻序列记为DH、候选新闻序列记为DC,将所述候选新闻序列DC中的任意一则候选新闻为xc,令所述候选新闻xc的点击标签为yc,yc∈{0,1},其中,yc=1表示用户u点击过候选新闻xc,yc=0表示用户u未点击候选新闻xc,由用户u点击过的所有候选新闻构成正样本集由用户u未点击过的所有候选构成负样本集
令D∈{DH,DC}表示用户u的历史点击新闻序列DH和候选新闻序列DC中任意一则新闻;对新闻D进行预处理,得到D的标题的单词序列WD、主题的ID序号TD、子主题的ID序号VD;
步骤2、分析用户u的点击行为,从而根据用户偏好与新闻的匹配度、新闻流行度以及用户的从众性特质构建因果图;
步骤3、构建新闻推荐模型,包括:用户偏好和新闻匹配度模块、融合从众性模型、MLP网络以及用户点击行为的预测模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310455876.4/2.html,转载请声明来源钻瓜专利网。