[发明专利]一种基于循环神经网络的社区问答专家推荐方法有效
申请号: | 201711077790.3 | 申请日: | 2017-11-06 |
公开(公告)号: | CN108021616B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 王健;孙吉庆;林鸿飞 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G06F40/30;G06F40/253 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 王丹;李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 神经网络 社区 问答 专家 推荐 方法 | ||
本发明公开了一种基于循环神经网络的社区问答专家推荐方法,其包括:对数据进行预处理;对所述问答社区所对应的全部用户进行候选专家筛选;构建各所述候选专家所对应的专家用户档案;基于特定领域知识的词向量训练获得词向量查找表;基于循环神经网络模型进行特征表示学习并构建社区问答专家推荐模型;基于构建社区问答专家推荐模型,确定待处理问答社区中的新的问题所对应的专家推荐顺序。本发明能有效地表示句子的语法和语义信息并且能够挖掘句子级别的高层次特征,减少了人工干预,并能进行自动的训练和学习。
技术领域
本发明涉及一种专家推荐方法,具体的说是涉及一种基于循环神经网络的社区问答专家推荐方法。
背景技术
互联网的快速发展改变了人们沟通的方式,更多的人越来越依赖他们的互联网社区来获取信息、咨询专业知识,如公众讨论论坛,社区建设的百科全书(例如维基百科)和社区问答(CQA)网站。在所有这些互联网服务中,利用CQA寻找自己所需的信息以及分享自己的专业知识最近在公众中获得了广泛的普及。伴随着社区问答网站上越来越多的问题得到解答,社区问答已经建立了一个大规模的、可以自由获取知识的知识仓库。它在满足提问者的需求的同时,还可以为广大的社会群体提供有价值的信息和知识。对于社区问答而言,从解答问题到构建知识仓库这整个过程都可以从获取高质量答案中获利,所以得到高质量的回答对社区问答而言是一个非常重要的问题。为社区问答系统中新提出的问题推荐相应的专家能够增强整个知识获取的过程。目前关于专家推荐的方法有以下几种:
一是基于词共现的方法:在用户给定问题之前,为每个在社区中注册过的用户建立用户档案,档案中是用户回答过的问题或者提问过的问题,当有其他用户提问问题时,会根据用户档案预测最佳的回答者,对问题中的词与出现过该词的用户档案进行检索并打分,这种方法需要包含用户的查询词,比如:VSM模型、Language Model模型、BM25模型、布尔模型等等。这种方法虽然比较经典,但是它忽略了没有共现词、语义相关的用户,不能很好地预测最佳回答者。
二是基于语义关联方法:针对提问者提问的问题,可以利用问题的语义信息检索用户档案,丰富查询结果。这类方法主要有潜在语义模型(LSA)、概率潜在语义分析模型(PLSA),以及现在非常流行的文档生成模型(LDA)等。这类方法在一定程度上提高了检索的召回率,但是引入了大量噪音信息,降低了准确度。如何准确高效的预测最佳回答者成为社区问答亟待解决的问题。
发明内容
鉴于已有技术存在的缺陷,本发明的目的是要提供一种基于循环神经网络的社区问答专家推荐方法,其能有效地表示句子的语法和语义信息并且能够挖掘句子级别的高层次特征,减少了人工干预,并能进行自动的训练和学习。
为了实现上述目的,本发明的技术方案:
一种基于循环神经网络的社区问答专家推荐方法,其特征在于,包括如下步骤:
步骤1、获取待处理问答社区所对应的一定时期内的Stack Overflow数据集中的数据并进行预处理;所述数据至少包括Stack Overflow数据集中标签为R语言的语料;
步骤2、对所述问答社区所对应的全部用户进行候选专家筛选,所述候选专家为待处理问答社区所对应的一定时期内的Stack Overflow数据集中其至少一个问题的回答被评选为最佳回答的用户,所述筛选至少包括基于统计分析的方法,对所述用户以其回答被评选为最佳回答的数量自多至少的顺序进行排列后,按照所设定筛选数量依次选择出相应的用户作为候选专家;
步骤3、构建各所述候选专家所对应的专家用户档案即获取每一所述候选专家回答过的问题中被选为最佳答案的全部的问题数据,并以所获取的问题数据中的问题的标签、问题的标题、问题的主体内容以及三者间的任意组合形式作为档案对应的单词组成的序列并组建对应的专家用户档案;
步骤4、基于特定领域知识的词向量训练获得词向量查找表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711077790.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及用于扫描显示装置的子像素阵列的方法
- 下一篇:冰箱