[发明专利]论坛帖子推荐方法、系统、设备及存储介质在审

专利信息
申请号: 201910211376.X 申请日: 2019-03-20
公开(公告)号: CN109871491A 公开(公告)日: 2019-06-11
发明(设计)人: 刘祥;罗竞佳;邓金秋;沙韬伟 申请(专利权)人: 江苏满运软件科技有限公司
主分类号: G06F16/9535 分类号: G06F16/9535
代理公司: 上海隆天律师事务所 31282 代理人: 臧云霄;夏彬
地址: 210012 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 帖子 论坛帖子 用户浏览 相似度 存储介质 词向量 文本 双层神经网络 文本相似度 用户满意度 模型实现 用户点击 用户推荐 用户喜好 通过率 浅层 论坛 喜好 采集 记录
【说明书】:

发明提供了一种论坛帖子推荐方法、系统、设备及存储介质,该方法包括:采集论坛中各个帖子的文本;计算所述帖子的文本中各个词的词向量;获取用户浏览的历史帖子记录;根据各个所述帖子的词向量,计算用户浏览的历史帖子与论坛中其他各个帖子的相似度;根据计算得到的相似度向用户推荐论坛帖子。通过采用本发明的方案,基于浅层双层神经网络模型实现推荐推荐与用户浏览的历史帖子相似度高的帖子,在文本相似度计算领域可以得到更好的效果,能够充分发掘用户喜好特征中的隐藏特性,更好地体现用户的喜好,从而提高用户满意度,进而提高用户点击通过率。

技术领域

本发明涉及计算机网络技术领域,尤其涉及一种论坛帖子推荐方法、系统、设备及存储介质。

背景技术

在司机论坛中,司机会把自己的一些意见、建议反馈出来,在反馈信息的同时,也可以通过PGC(Professional Generated Content,专业生成内容)产生一些高质量文章,解答司机运输、货运交接过程中的一些疑惑。在货物运输过程中,司机也会分享一些路途中的见闻、反馈自己对APP的一些观点等等。与此同时司机也会阅读论坛中的其他用户或者PGC的论坛帖子。为了提升司机的阅读效率,现有的论坛会分析司机的喜好,为司机推荐司机可能感兴趣的帖子来阅读。

现有的论坛推荐中,使用的技术往往是基于有监督的分类学习方法。现有技术大多通过主观性的从文章中提取特征,然后对所有文章进行multi label(多重标签)标记,然后基于此数据,进行有监督训练,最终得到训练结果。例如首先将论坛帖子中各个词的数据通过Naive Bayes(朴素贝叶斯)模型,计算给定类别的条件概率,最终通过生成式的方式得到最大可能类别。通过分析用户历史阅读记录,对用户阅读的文章进行排序,根据该用户对于某文章的喜爱程度,优先推荐同类别的文章。

然而,主观性的特征提取很难发现用户喜好中的隐藏特征;而且根据历史经验来看,朴素贝叶斯模型对于文本相似度性能并非太好;此外对于用户喜好文章列表,仅仅给出排序,无法量化喜好程度,推荐效果欠佳。

发明内容

针对现有技术中的问题,本发明的目的在于提供一种论坛帖子推荐方法、系统、设备及存储介质,能够充分发掘用户喜好特征中的隐藏特性,更好地体现用户的喜好,从而提高用户满意度。

本发明实施例提供一种论坛帖子推荐方法,所述方法包括如下步骤:

采集论坛中各个帖子的文本;

计算所述帖子的文本中各个词的Word2Vec词向量;

获取用户浏览的历史帖子记录;

根据各个所述帖子的Word2Vec词向量,计算用户浏览的历史帖子与论坛中其他各个帖子的相似度;

根据计算得到的相似度向用户推荐论坛帖子。

可选地,所述采集论坛中各个帖子的文本之后,还包括采用jieba分词方法对各个帖子的文本进行分词的步骤。

可选地,所述计算所述帖子的文本中各个词的Word2Vec词向量,包括如下步骤:

计算所述帖子的文本中各个词的独热编码向量;

将所述各个词的独热编码向量输入至训练好的Word2Vec模型,得到各个词的Word2Vec词向量,得到各个帖子的Word2Vec词向量;

可选地,所述Word2Vec模型为Skip-gram模型,所述Skip-gram模型包括输入层、隐藏神经网络层和输出层,所述各个词的独热编码向量输入所述输入层,所述隐藏层对所述独热编码向量进行降维处理,所述输出层对所述隐藏神经网络层的输出进行Softmax回归,输出与各个词的独热编码向量维度相同的Word2Vec词向量。

可选地,所述计算所述帖子的文本中各个词的Word2Vec词向量之后,还包括如下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏满运软件科技有限公司,未经江苏满运软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910211376.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top