[发明专利]一种基于深度学习的问答社区问题路由方法有效
申请号: | 201910122563.0 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109871439B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 董守斌;叶超;董守玲;胡金龙;袁华 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F30/27;G06Q50/00;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 问答 社区 问题 路由 方法 | ||
本发明公开了一种基于深度学习的问答社区问题路由方法,包括步骤:1)通过对社区问答的文本内容进行分词,利用词向量技术,获取单词的词向量表示;2)根据用户的历史回答记录,构建用户档案;3)利用深度学习根据用户档案分别学习用户兴趣预测模型、用户能力预测模型、用户响应度预测模型;4)根据步骤3)学习到的模型获取用户特征,进而根据用户特征训练打分模型;5)利用步骤3)学习的户兴趣预测模型、用户能力预测模型、用户响应度预测模型及步骤4)训练的打分模型,进行问题路由。本发明充分考虑到用户回答的评分信息和时间信息,通过单独的深度学习模型分别来预测用户对问题的评分及响应时间,在排序阶段充分利用了用户回答的评分、时间等信息。
技术领域
本发明涉及信息检索的技术领域,尤其是指一种基于深度学习的问答社区问题路由方法。
背景技术
随着Web2.0的飞速发展,社区问答(Community Question Answering)系统也逐渐成为一种非常流行而且实用的互联网应用。目前,在互联网上已经出现了很多社区问答系统,这些社区已经积累了大量的用户信息和内容资源,并呈现持续增长的态势。海量的历史数据为社区问答系统的发展带来了许多机遇和挑战。如何利用用户的历史行为数据,挖掘用户的兴趣领域及专业领域,为用户提出的问题推荐可能回答的专家用户,已经成为问答社区领域内的重要研究课题。
问题路由是问答社区的一个典型应用场景,它的目的就是为用户提出的问题推荐可能回答该问题的专家用户。目前,针对该问题的相关技术主要集中以下几类:基于传统的信息检索的方法、基于分类的方法和基于排序学习的方法。随着深度学习的广泛应用,也有很多方法利用深度学习来解决问答社区的问题路由问题。现有基于深度学习的技术方案主要包含以下两类:一类是基于多分类,把所有候选用户id当作类标签,输入用户历史记录文本与问题文本的特征向量,输出回答用户的id;另一类是基于语义相似度,通过深度学习来预测用户历史回答记录文本与问题文本的语义相似度,进而根据相似性进行问题路由。以上方法均只考虑了文本信息,忽略了用户回答的评分信息及回答的时间信息,用户信息利用的不够充分。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于深度学习的问答社区问题路由方法,通过采用深度学习的方法从历史记录中学习用户兴趣、能力、响应速度等特征,进而根据这些用户特征训练排序模型,从而实现问题路由。
为实现上述目的,本发明所提供的技术方案为:一种基于深度学习的问答社区问题路由方法,包括以下步骤:
1)通过对社区问答的文本内容进行分词,利用词向量技术,获取单词的词向量表示;
2)根据用户的历史回答记录,构建用户档案;
3)利用深度学习根据用户档案分别学习用户兴趣预测模型、用户能力预测模型、用户响应度预测模型;
4)根据步骤3)学习到的模型获取用户特征,进而根据用户特征训练打分模型;
5)利用步骤3)学习的用户兴趣预测模型、用户能力预测模型、用户响应度预测模型及步骤4)训练的打分模型,进行问题路由。
在步骤1)中,提取社区问题的文本内容,使用常用分词工具进行分词,这样就将数据分解成文档-词的形式;利用词向量工具在数据集上训练得到单词的词向量。
在步骤2)中,根据社区的历史数据,提取用户历史回答的相关信息,包括问题的文本、问题的发布时间、回答的得分和回答的时间,构建用户档案。
在步骤3)中,利用深度学习根据用户档案分别学习用户兴趣预测模型、用户能力预测模型、用户响应度预测模型;
用户兴趣预测模型的训练方式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910122563.0/2.html,转载请声明来源钻瓜专利网。