[发明专利]基于主题模型和机器学习的回答者推荐方法有效
申请号: | 201710733139.0 | 申请日: | 2017-08-24 |
公开(公告)号: | CN107562836B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 张莉;王丽婷;蒋竞;黎功辉 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06N20/00 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 祗志洁 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于主题模型和机器学习的回答者推荐方法,属于软件工程与机器学习领域。本发明同时考虑了用户的专业知识、主题和活跃度,扩展隐含的狄利克雷模型得到回答者推荐模型,将推荐问题转化为机器学习的分类问题,将用户主题分布、用户主题专业知识分布和用户主题活跃度分布转化为特征向量,得到用户的主题特征、专业知识特征和活跃度特征,从而得到一种问题回答者的推荐方法。本发明方法直观、简单、有效,在一定程度上解决了现有的问题回答者推荐方法缺乏对推荐的回答者能够及时回答的可能性以及对新问题推荐回答者的准确性等问题,并且能够更好地提高对问题推荐回答者的有效性和可用性。 | ||
搜索关键词: | 基于 主题 模型 机器 学习 回答者 推荐 方法 | ||
【主权项】:
一种基于主题模型和机器学习的回答者推荐方法,其特征在于,包括如下两方面:(一)基于扩展隐含的狄利克雷主题模型构建回答者推荐模型,所述回答者推荐模型包括三部分:用户的专业知识、用户的主题和用户的活跃度;包括如下步骤:步骤1,从问答社区中获取历史数据,得到每个用户在各个时间段内的问答记录,问答记录内容包括提问信息、回答信息和评论信息,对问答记录内容清理后获得主题模型训练的语料库,根据语料库训练得到主题模型和问题标签特征;并利用回答者获得的投票数作为回答者的专业知识水平,利用用户访问问答社区的记录计算用户的活跃度;步骤2,基于主题模型计算用户主题分布、主题词项分布、用户主题专业知识分布和用户主题活跃度分布;其中,用户主题分布表示为θu,k,用户主题专业知识分布为φk,u,e,用户主题活跃度分布为δk,u,a,主题词项分布为小脚标中,u代表用户,k代表主题,e代表专业知识水平,a代表活跃度等级,w代表词项;步骤3,将为问题推荐回答者的问题转化为机器学习领域的分类问题,将步骤2所获得的概率分布转化为机器学习的特征向量,获得用户的主题特征、专业知识特征和活跃度特征;步骤4,将主题特征、专业知识特征、活跃度特征和问题标签特征转化为特征向量,作为机器学习的输入,通过机器学习得到回答者推荐模型;(二)利用回答者推荐模型为提问者推荐回答者,包括:步骤5,当问答社区中有提问者提出新的问题时,对该问题进行特征提取,获得问题主题的分布θq,k;步骤6,利用回答者推荐模型获得问题回答者的推荐列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710733139.0/,转载请声明来源钻瓜专利网。
- 上一篇:一株戊糖片球菌及其应用
- 下一篇:一种基于道路网的机动目标跟踪算法