[发明专利]一种多模态的用户画像方法及系统在审
申请号: | 201910751330.7 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110517069A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中森云链(成都)科技有限责任公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 画像 多模态 用户数据 知识点 计算机技术 邻居关系 显式反馈 学习系统 业务需求 隐式反馈 应用能力 单模态 构建 应用 个性化 题目 预测 帮助 服务 研究 | ||
1.一种多模态的用户画像方法,其特征在于包括以下步骤:
步骤1:收集用户的历史做题数据,根据用户做题结果和题目画像得到用户的显式反馈、隐式反馈;同时根据是否做过相同题目,构建用户的邻居关系;
步骤2:将数据集划分为训练集和测试集;
步骤3:利用神经网络分别编码用户的显式反馈和隐式反馈,得到两种不同的用户隐表示;
步骤4:利用一个神经门结构融合从显式反馈和隐式反馈中学习到的用户隐表示;
步骤5:基于融合的用户隐表示,利用用户的邻居关系,预测用户对不同知识点的掌握程度。
2.根据权利要求1所述的一种多模态的用户画像方法,其特征在于:所述步骤1是收集用户的历史做题数据,根据用户做题结果和题目画像得到用户的显式反馈、隐式反馈;同时根据是否做过相同题目,构建用户的邻居关系,具体方法如下:对于用户集合U,其大小为n,表示n个用户;题目知识点集合I,其大小为m,表示m个知识点;根据用户做题结果,其中1表示做题正确,0表示做题错误,-1表示点击但没有做题,将做题结果为-1的历史记录作为隐式反馈,其余历史记录作为显式反馈;对用户的显式反馈和隐式反馈进行统计分析,得到用户在知识点上的正确率和点击率的画像,步骤如下:
a1.定义两个n行m列矩阵,分别是用户-知识点正确率矩阵A和用户-知识点点击率矩阵H,矩阵元素分别为用户在知识点上的正确率和点击率,分别由用户的显式反馈和隐式反馈统计得到,具体地,用户u在知识点i上的正确率aui计算方式为:用户在知识点i上做对的题目数占用户在该知识点上做题总数的百分比;用户u在标签i上的点击率hui计算方式为:用户在知识点i上点击过的题目数占用户点击总数的百分比;这里的题目画像由人工标注的知识点构成;
a2.设置一个阈值,当两个用户做过相同题目的数量大于该值时,认为这两个用户是邻居,据此构建系统中用户的邻居关系;
由于人工标注的不完整和有限的用户做题记录,a1中得到的正确率矩阵A非常稀疏,本发明旨在利用用户的隐式反馈和邻居关系数据帮助预测用户在各个知识点上正确率,其反映了用户对各个知识点的掌握程度。
3.根据权利要求1所述的一种多模态的用户画像方法,其特征在于:所述步骤2是将数据集划分为训练集和测试集,具体方法为:对每个用户,随机选择20%的知识点正确率数据作为测试集,用剩余的知识点正确率数据进行训练。
4.根据权利要求1所述的一种多模态的用户画像方法,其特征在于:所述步骤3是利用神经网络分别编码用户的显式反馈和隐式反馈,得到两种不同的用户隐表示;具体过程如下:
b1.根据用户-知识点正确率矩阵A,对每个用户u,矩阵A的第u行代表该用户的显式反馈,表示为au;使用一个全连接网络对au进行编码,得到用户u在显式反馈上的隐表示计算如下:
其中,Wau∈Rm*d是待学习的网络参数,d是隐表示的维度,bau∈Rd是偏置向量;
b2.根据用户-知识点点击率矩阵H,对每个用户u,矩阵H的第u行代表该用户的隐式反馈,表示为hu;使用另一个全连接网络对hu进行编码,得到用户u在隐式反馈上的隐表示计算如下:
其中,Wah∈Rm*d是待学习的网络参数,d是隐表示的维度,bhu∈Rd是偏置向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中森云链(成都)科技有限责任公司,未经中森云链(成都)科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910751330.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人脸识别的智能终端播放设备
- 下一篇:一种消费者人群圈选方法及装置