[发明专利]一种基于BERT模型的个性化新闻推荐系统在审
申请号: | 202211427935.9 | 申请日: | 2022-11-15 |
公开(公告)号: | CN115587256A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 巩书凯;王越;姜仁杰;邓俊;江虹锋 | 申请(专利权)人: | 重庆忽米网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 黄河 |
地址: | 400041 重庆市高新*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bert 模型 个性化 新闻 推荐 系统 | ||
本发明涉及新闻咨询推荐技术领域,尤其涉及一种基于BERT模型的个性化新闻推荐系统,包括过滤单元、分类单元、推荐单元和偏好分析单元;过滤单元用于对新闻进行内容过滤;分类单元用于通过预设的分类模型对过滤后的新闻进行主题分类,确定新闻的类别;偏好分析单元用于根据用户的浏览历史数据,对用户进行行为特征分析;推荐单元用于根据用户的行为特征分析结果,从过滤后的新闻中为用户推荐对应类别的新闻。本发明能够为用户推荐符合其个性化需求且有质量保证的新闻。
技术领域
本发明涉及新闻咨询推荐技术领域,尤其涉及一种基于BERT模型的个性化新闻推荐系统。
背景技术
在新闻资讯领域中,通过分析用户当前浏览信息、用户历史浏览记录和热点新闻等等来推测用户接下来最想要阅读的新闻,尤其在当前新闻数量爆发式增长的情况下,个性化新闻推荐系统根据用户的行为喜好将新闻自动推荐给用户,有助于实现用户和平台新闻资讯的双赢。
在新闻数据来源十分丰富的同时,也带来了一些挑战,比如有的新闻中出现的损害用户的身心健康的词汇,或者有的新闻为了吸引眼球,标题内容和新闻内容完全不相符合,又或者有的新闻诱导用户去高消费,容易对用户造成经济损失。这些新闻对于用户来说都非常不友好。
因此,怎样才能为用户推荐符合其个性化需求且有质量保证的新闻,成为目前亟待解决的问题。
发明内容
针对上述现有技术的不足,本发明提供了一种基于BERT模型的个性化新闻推荐系统,能够为用户推荐符合其个性化需求且有质量保证的新闻。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种基于BERT模型的个性化新闻推荐系统,包括过滤单元、分类单元、推荐单元和偏好分析单元;
过滤单元用于对新闻进行过滤;
分类单元用于通过预设的分类模型对过滤后的新闻进行主题分类,确定新闻的类别;
偏好分析单元用于根据用户的浏览历史数据,对用户进行行为特征分析;
推荐单元用于根据用户的行为特征分析结果,从过滤后的新闻中为用户推荐对应类别的新闻。
优选地,过滤单元采用新闻内容过滤的方式对新闻进行过滤时,过滤的步骤包括文本去重、敏感词过滤、垃圾新闻分类。
优选地,分类单元的工作过程包括:
首先进行数据处理,将数据标签构造为向量的形式,以适应多标签分类;
然后使用结合MLP和BiGRU的BERT分类模型来构建多标签分类算法;
最后训练模型对新闻进行主题分类。
优选地,结合MLP和BiGRU的BERT分类模型包括由多层Transformer结构堆叠形成BERT网络,新闻数据的新闻文本信息CLS和语句信息SEP通过嵌入层嵌入为新闻数据向量输入至BERT网络,BERT网络的新闻文本分类输出端连接至多层感知神经网络MLP,BERT网络的语句信息分类输出端连接至双向长短时记忆神经网络BiGRU,然后多层感知神经网络MLP和双向长短时记忆神经网络BiGRU的输出端通过合并连接器concat合并后连接至分类器。
优选地,推荐单元通过预设的xDeepFM模型进行新闻推荐。
优选地,推荐单元包括离线子单元及在线子单元;离线子单元用于每天定时为用户推荐预设数量的新闻并存储在预设的推荐表中;在线子单元用于离线子单元的推荐内容分发完之后进行新闻的实时推荐。
优选地,偏好分析单元对用户进行行为特征分析时,根据用户的历史行为数据去提取用户行为特征,再通过预设的推荐模型训练来学习用户的行为习惯和兴趣爱好。
优选地,偏好分析单元通过关键词提取的方式,对用户的历史行为数据进行行为特征提取;其中,偏好分析单元通过关键词提取时,通过TextRank算法来进行关键词的提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆忽米网络科技有限公司,未经重庆忽米网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211427935.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纺织污水循环利用处理系统
- 下一篇:一种超导集流体及其制备方法