[发明专利]回答者推荐模型的训练方法、推荐方法及电子设备在审
申请号: | 202010767815.8 | 申请日: | 2020-08-03 |
公开(公告)号: | CN111881282A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 陈卓;袁玺明;杜军威;葛艳;李涵;姜伟豪;魏锐 | 申请(专利权)人: | 青岛科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N20/20 |
代理公司: | 北京力致专利代理事务所(特殊普通合伙) 11900 | 代理人: | 周厚民 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 回答者 推荐 模型 训练 方法 电子设备 | ||
本发明数据挖掘技术领域,具体涉及回答者推荐模型的训练方法、推荐方法及电子设备。训练方法包括获取样本评分矩阵以及未获得财富值的数据集;未获得财富值的数据集包括回答者特征以及问题特征;利用未获得财富值的数据集对回答者推荐模型中的DeepFM模块进行训练,以填充样本评分矩阵;将填充后的样本评分矩阵输入回答者推荐模型中的矩阵分解模块分解样本评分矩阵,得到回答者矩阵以及问题矩阵;基于回答者矩阵与问题矩阵,预测问题对应的回答者;利用评分预测值与问题对应的目标评分值,对DeepFM模块以及矩阵分解模块的参数进行更新,确定回答者推荐模型。该回答者推荐模型中DeepFM模块与矩阵分解模块组成了一个强学习器,提高了预测结果的准确性。
技术领域
本发明涉及数据挖掘技术领域,具体涉及回答者推荐模型的训练方法、推荐方法及电子设备。
背景技术
随着网络的高速发展,书本的知识难以满足人们日益增长的知识需求,问答社区成为了人们分享经验与获取知识的新平台。以海川化工论坛为例,其是国内最大的专业化工问答社区和化工类交流的专业平台,日均访客10万其中95%以上的访客均为从业人员,成员来自于国内各大设计院、生产制造企业、销售单位及各大高校。在海川化工论坛近十年的数据中,有超过400万用户和超过100万个问题,其中近三分之一的问题没有获得明确的答案,同时论坛每天都会产生大量的问题,需要有回答能力的用户来解决。一方面是有许多问题没有被有能力的回答者发现,导致问题长时间无人问津,社区内出现了大量无人回答的问题。另一方面是有能力回答问题的用户没有发现与自己专业、能力相匹配的问题,海量不相关的问题,导致用户回答问题的效率变低,用户对社区的兴趣度下降。
为了解决上述问题,推荐成为了海川化工论坛的关键技术,推荐的目的是根据回答者的能力为用户提供力所能及解决的问题。目前推荐系统在应用到海川化工论坛时,主要面临两大技术挑战:(1)稀疏性:由于用户往往只与少数项目进行交互,因此很难训练出一个准确的推荐模型,特别是对于交互次数较少的用户或项目;(2)冷启动:在海川化工论坛,超过400万用户中,仅有不到30万的用户参与回答问题,绝大多数用户没有用户行为,处理这些问题或预测用户对这些项目的偏好是具有挑战性的,这就是所谓的“冷启动”问题。因此,上述两大技术挑战导致现有的推荐方法在为新问题预测回答者的应用中,预测准确性偏低。
发明内容
有鉴于此,本发明实施例提供了一种回答者推荐模型的训练方法、推荐方法及电子设备,以解决现有推荐方法的预测准确性偏低的问题。
根据第一方面,本发明实施例提供了一种回答者推荐模型的训练方法,包括:
获取样本评分矩阵以及未获得财富值的数据集;其中,所述未获得财富值的数据集包括回答者特征以及问题特征;
利用所述未获得财富值的数据集对回答者推荐模型中的DeepFM模块进行训练,以填充所述样本评分矩阵;
将填充后的所述样本评分矩阵输入所述回答者推荐模型中的矩阵分解模块分解所述样本评分矩阵,得到回答者矩阵以及问题矩阵;
基于所述回答者矩阵与所述问题矩阵,预测所述问题对应的回答者;
利用所述评分预测值与所述问题对应的目标评分值,对所述DeepFM模块以及所述矩阵分解模块的参数进行更新,确定所述回答者推荐模型。
本发明实施例提供的回答者推荐模型的训练方法,利用DeepFM模块对将一些参与回答但未获得财富值的回答进行财富值填充,使得填充后的样本评分矩阵更加稠密同时也解决了冷启动问题,利用矩阵分解模块提高了预测的准确性。因此,训练得到的回答者推荐模型中DeepFM模块与矩阵分解模块组成了一个强学习器,提高了预测结果的准确性。
结合第一方面,在第一方面第一实施方式中,所述基于所述回答者矩阵以及所述问题矩阵,预测所述问题对应的回答者,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010767815.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于虚拟端口的数据转发系统及方法
- 下一篇:掉帧检测方法和装置