[发明专利]一种针对社区问答平台的答者推荐方法在审
申请号: | 202110338095.8 | 申请日: | 2021-03-30 |
公开(公告)号: | CN112989197A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 方胡彬;高红雨;苏航 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/33;G06F16/35;G06F40/216;G06Q50/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 社区 问答 平台 推荐 方法 | ||
本发明公开了一种针对社区问答平台的回答者推荐方法,包括以下步骤:对数据进行预处理,提取出平台中所有用户相关信息数据,并对问答帖子的文本内容进行文字预处理;根据用户提出问题的标题、关键字、标签和文本内容,进行Jaccard相似度和TF‑IDF余弦相似度的计算,找出与它属于同一类的问题帖子;在这个分类的帖子中找出回答的用户,这些用户都回答过和原问题相似的问题,依据之前提取的这些回答者的用户信息数据,分析这些用户信息数据找出对评价用户质量和用户回答倾向有决定作用的信息作为用户的属性特征,并对这些属性特征使用不同的权重;对这些属性值与权重进行累加和,得出的数值中最高的几个回答者作为最终的推荐结果。本发明可以有效帮助提问者找到所提出问题的潜在回答者,解决问题长时间没人回答的困境。
技术领域
本发明属于推荐技术领域,具体属于一种针对社区问答平台的回答者推荐方法。
背景技术
传统的推荐方法有协同过滤、基于内容的推荐、基于关联规则的推荐,这些方法都有各自的优缺点,比如协调过滤的优点是:能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度;能够过滤难以进行机器自动内容分析的信息;缺点是:数据稀疏性问题和可扩展性问题。基于内容的推荐的优点是:没有冷启动、新项目和数据稀疏问题;能为具有特殊兴趣爱好的用户进行推荐;缺点是:所推荐的内容必须能抽象出有意义的特征,并且具有良好的结构性。
发明内容
本发明旨在解决以上出现的技术问题,提出一种针对社区问答平台的回答者推荐方法。
一般社区问答平台中回答某一话题帖子比较多的用户也有回答相似帖子的倾向,所以首先可以根据问题帖子的相似程度,对问题帖子进行划分。问题帖子除了显示标记的标签信息可以用来分类,其标题中的文本信息也可以用来进行相似度的计算。根据问题帖子中包含的标签和标题,计算Jaccard相似度。
Jaccard相似度:
Jaccard(A,B)=|A∩B|÷|AUB|
其中A是原有问题中的标题集合,B是新问题中的标题集合。
接下来,对于问题帖子的文本内容,运用一个结合文本词汇频率(TermFrequency)和逆文本频率(Inverse Document Frequency)的混合模型,使用文本体上的余弦相似度测量方法计算帖子文本内容的余弦相似度。TF-IDF是一个数值统计,旨在反映一个词在一个集合或语料库中对文档的重要程度,并作为给定用户查询的文档相关性打分和排名的核心工具。帖子数据中的内容文本都是对问题或回答的文字描述,文字内容越相近说明这两个帖子越相似。
TF-IDF:
tf-idf(t,d,D)=tf(t,d)×idf(t,D)
其中N:语料库中的文档总数,N=|D||{d∈D,t∈d}|,术语t出现的文档数。D表示文档,d表示文档中的一项,t表示一个文档中的一条术语。
余弦相似度:
其中Ai和Bi分别是向量A和B的分量。
进一步的,根据Jaccard相似度和TF-IDF余弦相似度对提问帖子进行划分后,根据问题所在的分类,在这个分类中查找对应的回答,再找到这些回答对应的用户,这些用户都是潜在的相似新问题的回答者。在这里推荐比较可能回答相似问题的用户时,考虑了系统对用户过去历史行为评价的一些属性特征,比如用户声誉值、用户主页浏览数、用户评分、用户徽章数、用户发帖数量等,并对这些用户属性特征使用不同的权重。使用逻辑回归的方法来确定这些权重参数值,对这些属性值与权重进行累加和,得出的数值中最高的几个作为最终的推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110338095.8/2.html,转载请声明来源钻瓜专利网。