[发明专利]论坛帖子推荐方法、系统、设备及存储介质在审
申请号: | 201910211376.X | 申请日: | 2019-03-20 |
公开(公告)号: | CN109871491A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 刘祥;罗竞佳;邓金秋;沙韬伟 | 申请(专利权)人: | 江苏满运软件科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;夏彬 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 帖子 论坛帖子 用户浏览 相似度 存储介质 词向量 文本 双层神经网络 文本相似度 用户满意度 模型实现 用户点击 用户推荐 用户喜好 通过率 浅层 论坛 喜好 采集 记录 | ||
1.一种论坛帖子推荐方法,其特征在于,包括如下步骤:
采集论坛中各个帖子的文本;
计算所述帖子的文本中各个词的Word2Vec词向量;
获取用户浏览的历史帖子记录;
根据各个所述帖子的Word2Vec词向量,计算用户浏览的历史帖子与论坛中其他各个帖子的相似度;
根据计算得到的相似度向用户推荐论坛帖子。
2.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述采集论坛中各个帖子的文本之后,还包括采用jieba分词方法对各个帖子的文本进行分词的步骤。
3.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述计算所述帖子的文本中各个词的Word2Vec词向量,包括如下步骤:
计算所述帖子的文本中各个词的独热编码向量;
将所述各个词的独热编码向量输入至训练好的Word2Vec模型,得到各个词的Word2Vec词向量,得到各个帖子的Word2Vec词向量;
4.根据权利要求3所述的论坛帖子推荐方法,其特征在于,所述Word2Vec模型为Skip-gram模型,所述Skip-gram模型包括输入层、隐藏神经网络层和输出层,所述各个词的独热编码向量输入所述输入层,所述隐藏层对所述独热编码向量进行降维处理,所述输出层对所述隐藏神经网络层的输出进行Softmax回归,输出与各个词的独热编码向量维度相同的Word2Vec词向量。
5.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述计算所述帖子的文本中各个词的Word2Vec词向量之后,还包括如下步骤:
对所述帖子中各个词的词向量进行筛选,将符合预设筛选条件的词向量筛除。
6.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述计算用户浏览的历史帖子与论坛中其他各个帖子的相似度,包括如下步骤:
计算用户浏览的历史帖子中各个词与论坛中一帖子中各个词的相似度,并将计算得到的相似度结果取平均值,作为两个帖子的相似度。
7.根据权利要求6所述的论坛帖子推荐方法,其特征在于,采用余弦相似度计算方法或欧氏距离计算方法计算用户浏览的历史帖子中各个词与论坛中一帖子中各个词的相似度。
8.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述根据计算得到的相似度向用户推荐论坛帖子,包括如下步骤:
判断一论坛帖子与用户浏览的历史帖子的相似度是否大于预设相似度阈值;
如果是,则将该论坛帖子作为推荐的论坛帖子。
9.根据权利要求1所述的论坛帖子推荐方法,其特征在于,还包括如下步骤:
获取用户对于每次推荐的论坛帖子的点击数据;
计算用户实际点击的推荐帖子与推荐的论坛帖子的数量比值;
判断所述数量比值是否处于预设比值范围内;
如果所述数量比值大于所述预设比值范围的上限值,则调低所述预设相似度阈值;
如果所述数量比值小于所述预设比值范围的下限值,则调高所述预设相似度阈值。
10.一种论坛帖子推荐系统,其特征在于,应用于权利要求1至9中任一项所述的论坛帖子推荐方法,所述系统包括:
文本采集模块,用于采集论坛中各个帖子的文本;
词向量计算模块,用于计算所述帖子的文本中各个词的Word2Vec词向量;
用户记录获取模块,用于获取用户浏览的历史帖子记录;
相似度计算模块,用于根据各个所述帖子的Word2Vec词向量,计算用户浏览的历史帖子与论坛中其他各个帖子的相似度;
帖子推荐模块,用于根据计算得到的相似度向用户推荐论坛帖子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏满运软件科技有限公司,未经江苏满运软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910211376.X/1.html,转载请声明来源钻瓜专利网。