[发明专利]一种融合从众性建模的去偏新闻推荐方法在审
申请号: | 202310455876.4 | 申请日: | 2023-04-25 |
公开(公告)号: | CN116578776A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张琨;鲍纪敏;吴乐;汪萌 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F18/25;G06F18/214;G06Q10/04 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 从众 建模 新闻 推荐 方法 | ||
1.一种融合从众性建模的去偏新闻推荐方法,其特征是按如下步骤进行:
步骤1、获取用户历史交互新闻数据集Q,并将其中任一用户u的历史点击新闻序列记为DH、候选新闻序列记为DC,将所述候选新闻序列DC中的任意一则候选新闻为xc,令所述候选新闻xc的点击标签为yc,yc∈{0,1},其中,yc=1表示用户u点击过候选新闻xc,yc=0表示用户u未点击候选新闻xc,由用户u点击过的所有候选新闻构成正样本集由用户u未点击过的所有候选构成负样本集
令D∈{DH,DX}表示用户u的历史点击新闻序列DH和候选新闻序列DC中任意一则新闻;对新闻D进行预处理,得到D的标题的单词序列WD、主题的ID序号TD、子主题的ID序号VD;
步骤2、分析用户u的点击行为,从而根据用户偏好与新闻的匹配度、新闻流行度以及用户的从众性特质构建因果图;
步骤3、构建新闻推荐模型,包括:用户偏好和新闻匹配度模块、融合从众性模型、MLP网络以及用户点击行为的预测模块;
步骤3.1、所述用户偏好和新闻匹配度模块用于得到用户偏好和新闻的匹配度结果muc;
步骤3.2、所述融合从众性模型用于得到用户u的历史点击新闻序列DH的所有新闻的流行度结果sH和候选新闻序列DX中的候选新闻xc的流行度结果sc以及用户u的初步从众性特质结果
步骤3.3、所述用户u的初步从众性特质结果输入所述MLP网络中进行处理,得到用户u的权重
所述历史点击新闻序列DH中所有新闻的流行度结果sH输入MLP网络中进行处理,得到历史点击新闻DH的权重wa;
步骤3.4、利用式(1)得到用户u的最终从众性特质结果cu:
式(1)中,Softplus(·)表示激活函数;
步骤3.5、所述用户点击行为预测模块通过式(2)预测用户u对候选新闻xc的点击概率分数结果
步骤4、利用负对数似然损失函数对新闻推荐模型进行迭代训练;
步骤4.1、利用负采样方法在所述正样本集中采样一个正样本同时在所述负样本集中随机采样K个负样本从而利用式(3)得到正样本的点击概率分数和K个负样本的点击概率分数其中,表示第j个负样本,即第j则未点击的候选新闻,表示第j个负样本的点击概率分数;
利用式(3)得到正样本的后验点击概率分数pui:
步骤4.2、利用式(4)构建负对数似然损失函数
式(4)中,puD表示用户u对新闻D的后验点击概率分数;
步骤4.3、基于用户u的历史点击新闻序列DH和候选新闻序列DC对所述新闻推荐模型进行训练,并采用AdamW优化器对所述负对数似然损失函数进行最小化求解,从而对模型所有参数进行优化,并得到最优新闻推荐模型,用于预估用户对新闻的点击率;
步骤5、在推理阶段,将新闻流行度结果sc设为定值s*,将用户从众性特质cu分别设为定值c*,从而所述最优新闻推荐模型通过式(5)预测用户u对候选新闻xc的点击概率分数
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310455876.4/1.html,转载请声明来源钻瓜专利网。