[发明专利]论坛帖子推荐方法、系统、设备及存储介质在审

申请号：	201910211376.X	申请日：	2019-03-20
公开（公告）号：	CN109871491A	公开（公告）日：	2019-06-11
发明（设计）人：	刘祥;罗竞佳;邓金秋;沙韬伟	申请（专利权）人：	江苏满运软件科技有限公司
主分类号：	G06F16/9535	分类号：	G06F16/9535
代理公司：	上海隆天律师事务所 31282	代理人：	臧云霄;夏彬
地址：	210012 江苏省南京市***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	帖子论坛帖子用户浏览相似度存储介质词向量文本双层神经网络文本相似度用户满意度模型实现用户点击用户推荐用户喜好通过率浅层论坛喜好采集记录
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种论坛帖子推荐方法，其特征在于，包括如下步骤：

采集论坛中各个帖子的文本；

计算所述帖子的文本中各个词的Word2Vec词向量；

获取用户浏览的历史帖子记录；

根据各个所述帖子的Word2Vec词向量，计算用户浏览的历史帖子与论坛中其他各个帖子的相似度；

根据计算得到的相似度向用户推荐论坛帖子。

2.根据权利要求1所述的论坛帖子推荐方法，其特征在于，所述采集论坛中各个帖子的文本之后，还包括采用jieba分词方法对各个帖子的文本进行分词的步骤。

3.根据权利要求1所述的论坛帖子推荐方法，其特征在于，所述计算所述帖子的文本中各个词的Word2Vec词向量，包括如下步骤：

计算所述帖子的文本中各个词的独热编码向量；

将所述各个词的独热编码向量输入至训练好的Word2Vec模型，得到各个词的Word2Vec词向量，得到各个帖子的Word2Vec词向量；

4.根据权利要求3所述的论坛帖子推荐方法，其特征在于，所述Word2Vec模型为Skip-gram模型，所述Skip-gram模型包括输入层、隐藏神经网络层和输出层，所述各个词的独热编码向量输入所述输入层，所述隐藏层对所述独热编码向量进行降维处理，所述输出层对所述隐藏神经网络层的输出进行Softmax回归，输出与各个词的独热编码向量维度相同的Word2Vec词向量。

5.根据权利要求1所述的论坛帖子推荐方法，其特征在于，所述计算所述帖子的文本中各个词的Word2Vec词向量之后，还包括如下步骤：

对所述帖子中各个词的词向量进行筛选，将符合预设筛选条件的词向量筛除。

6.根据权利要求1所述的论坛帖子推荐方法，其特征在于，所述计算用户浏览的历史帖子与论坛中其他各个帖子的相似度，包括如下步骤：

计算用户浏览的历史帖子中各个词与论坛中一帖子中各个词的相似度，并将计算得到的相似度结果取平均值，作为两个帖子的相似度。

7.根据权利要求6所述的论坛帖子推荐方法，其特征在于，采用余弦相似度计算方法或欧氏距离计算方法计算用户浏览的历史帖子中各个词与论坛中一帖子中各个词的相似度。

8.根据权利要求1所述的论坛帖子推荐方法，其特征在于，所述根据计算得到的相似度向用户推荐论坛帖子，包括如下步骤：

判断一论坛帖子与用户浏览的历史帖子的相似度是否大于预设相似度阈值；

如果是，则将该论坛帖子作为推荐的论坛帖子。

9.根据权利要求1所述的论坛帖子推荐方法，其特征在于，还包括如下步骤：

获取用户对于每次推荐的论坛帖子的点击数据；

计算用户实际点击的推荐帖子与推荐的论坛帖子的数量比值；

判断所述数量比值是否处于预设比值范围内；