[发明专利]一种问答社区专家推荐方法、系统及应用在审
申请号: | 202110109051.8 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112765326A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 赵楠;马玉伟;陈南;易运晖;张盛祥 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/9536;G06Q50/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 何畏 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问答 社区 专家 推荐 方法 系统 应用 | ||
1.一种问答社区专家推荐方法,其特征在于,所述问答社区专家推荐方法包括:
步骤一,构建社区用户问答交互关系;
步骤二,利用LDA提炼用户文档主题分布;
步骤三,计算用户之间主题相关性;
步骤四,利用用户历史问答中收到的反馈评估用户长期累积的质量因子;
步骤五,计算社区用户的专家得分;
步骤六,给定新问题q和一组测试用户U,根据用户兴趣和专业知识水平对所有用户进行排名,以回答问题q;
步骤三中,利用下式计算用户之间主题相关性:
simz(j→i)=1-(|θj,z-θi,z|);
其中,θ是由LDA提取文档主题求解得到的参数;
步骤四中,利用用户历史问答中收到的反馈来评估用户长期以来累积的质量因子:
其中,ASi表示用户i的累积质量因子,Qi为用户i的所有历史问答集合,N为问答集合中问答贴数量;如果q为用户i的提问贴,那么收到投票数Vq=Sumq,所得投票权重为1;如果q为用户i的回答贴,那么该贴质量由收到的投票数Vq占该贴对应提问贴的所有回答帖收到的投票总数Sumq的投票权重表示;
步骤五中,所述计算社区用户的专家得分,包括:
(1)利用下述图链接分析公式,结合用户主题相似性计算社区用户t时刻在主题z下的权威值得分:
其中,N表示社区内问答用户总数,除地面节点外的所有用户节点的初始权威值为一个单位值,设置AUz,i(0)=1,地节点的初始权威值设置为AUg(0)=0,pz(j→i)表示给定主题z,迭代计算过程中用户j将自己的权威值分配给用户i的概率,计算如下:
其中,uji表示用户i回答过用户j问题的次数;转移概率考虑用户之间的交互数量关系,同时考虑问答用户可能拥有相同的主题兴趣;
通过不断地迭代计算,用户的权威值会在tc时刻趋于稳定,用户的权威值计算公式如下:
其中,AUz,i(tc)表示用户i在主题z下于tc时刻达到稳态的权威值,AUg(tc)表示地节点在tc时刻达到稳态的权威值;
(2)结合链接分析方法计算结果与用户累积质量因子计算用户专家得分:
Sz,i=AUz,i·(1+ASi);
其中,Sz,i表示用户i在主题z下的最终权威值,即专家得分;
步骤六中,所述用户推荐得分计算如下:
其中,Recu是用户u的推荐得分,JS(·)是JS散度距离,(1-JS(θu,θq))用来计算用户和问题之间的相似性,θq,z表示问题q在主题z下的分布;
步骤六中,概率转移与用户累积质量因子结合如下:
其中,Qj,i表示用户i回答过用户j问题的集合,Vq,i表示用户i回答问题q所得投票数;
步骤一中,所述构建社区用户问答交互关系,包括:
下载开源编程问答社区中所有用户的问答交互信息,导出每个用户的问答文档、每个问答文档得到的投票数,利用编程工具结合统计方法得到用户之间的问答数量关系;
步骤二中,所述利用LDA提炼用户文档主题分布,包括:
LDA模型在对文档提取主题过程中,会生成文档-主题分布θ和主题-词项分布接着利用吉布斯采样法对LDA模型参数进行求解。
2.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1所述的问答社区专家推荐方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110109051.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于甘特图的深度编辑使用的项目管理方法
- 下一篇:一种健身器材