[发明专利]一种基于神经网络的新闻推荐方法有效
申请号: | 202010431112.8 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111639258B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 罗轶凤;朱鹏 | 申请(专利权)人: | 苏州遐迩信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00;G06N3/0464;G06N3/08 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 杨林洁 |
地址: | 215332 江苏省苏州市昆山*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 新闻 推荐 方法 | ||
本发明涉及一种基于神经网络的新闻推荐方法,利用用户之前点击过的阅读新闻信息和用户的社交信息这两部分信息进行用户特征表示,当出现一个新的没有阅读过的新闻时,也就是候选新闻,新闻推荐方法根据用户特征表示和候选新闻表示之间的相似性来考虑用户是否单击该候选新闻。本发明与现有技术相比具有为新闻的推荐工作提供了一个新的解决方案,方法简便,效率高。
技术领域
本发明涉及网络上信息推荐技术领域,尤其是涉及一种基于神经网络的新闻推荐方法。
背景技术
随着万维网的广泛普及,大量新闻正在迅速出现,并且信息严重超载,因此用户别无选择。新闻推荐的出现减轻了信息过载,并帮助用户快速准确地获取他们感兴趣的新闻。当前,常用的推荐方法是基于内容的过滤(CB),协作过滤(CF)和混合方法。在新闻推荐领域,基于内容的推荐算法是基于对读者过去感兴趣的文档进行分析,以推荐更多相关文档。
有研究者提出了一种基于内容的模型和余弦相似度搜索的快速新闻推荐方法,尽管该算法具有很高的解释性,并且没有冷启动的问题,但是在建议的多样性方面不足,因此难以挖掘用户的潜在偏好。与Google的新闻个性化系统类似,协作过滤取决于社区中的协作过滤和兴趣模式,而不管新闻文章的内容如何。有研究者提出了一种自适应用户分析模型,该模型将协作过滤应用于相似用户组阅读的新闻列表,并以传统方式将新闻视为项目,协作过滤算法需要积累用户的点击行为来进行推荐,从而导致用户冷启动的问题。混合推荐算法主要采用基于内容和协同过滤的推荐算法,也有研究者提出了一种基于内容推荐和协同过滤的新闻推荐方法,该方法对传统的基于内容的方法进行了改进,以获得用户的兴趣,通过特征词的协同过滤获得用户的潜在兴趣,并将用户的兴趣与潜在的兴趣相结合,从而获得集成的用户兴趣模型,然后提出新闻建议。
混合推荐算法在一定程度上解决了基于内容的推荐多样性的问题,但其准确性有待提高。一些研究表明,使用Twitter信息进行新闻推荐具有高度相关性。还有研究者研究了一种使用Twitter推荐实时时事的方法,其中用户个人资料由文章组成,这是使用TF-IDF计算得出的术语。还有人提出将新闻与社交媒体上的信息(推文)结合起来以建立三种用户个人资料,然后计算用户与新闻文章之间的余弦相似度。
从以上研究可以发现,很少有学者研究过用户的社交关系对新闻推荐的影响,而且大多数学者只关注单一属性或者没有被应用到新闻推荐中。
发明内容
本发明的目的是针对现有技术的不足而设计的一种基于神经网络的新闻推荐方法,利用用户的社交信息和用户之前阅读过的新闻信息进行推荐,用用户的社交信息和之前阅读过的新闻信息来对用户进行最终表征,然后根据用户的最终表征和候选新闻的最终表征之间的相似性来考虑用户是否单击候选新闻。
本发明解决其技术问题所采用的技术方案是:一种基于神经网络的新闻推荐方法,该推荐方法的步骤为,
S1、获取原有数据库内部分的新闻信息及所有的用户信息;
S2、利用FastText工具对获取的新闻信息中的标题与内容进行学习,获取固定长度的词向量并组成相应的词汇表;
S3、对数据库内获取的新闻信息按照不同的用户信息进行人工标注,人工标注的标准为是否为该用户已经阅读的新闻信息,已经阅读的新闻信息为阅读新闻信息,未被阅读的新闻信息为候选新闻信息;
S4、对获取的不同用户的阅读新闻信息与候选新闻信息,利用开源工具对标题与内容进行分词标注;
S5、将已经人工标注及分词标注的新闻信息组成新闻数据集,将获取的用户信息组成用户数据集,对新闻数据集及用户数据集进行整理和预处理,得到训练集与测试集,训练集由阅读新闻信息及用户信息组成,测试集由候选新闻信息与用户信息组成;
S6、利用步骤S5中训练集进行训练,得到新闻信息的推荐模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州遐迩信息技术有限公司,未经苏州遐迩信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010431112.8/2.html,转载请声明来源钻瓜专利网。