[发明专利]一种基于用户记录的习题相似度计算推荐方法有效
申请号: | 201910444120.3 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110334204B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 王汉武;骆益军 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F40/289;G06F40/216;G06K9/62;G06N3/08 |
代理公司: | 长沙麓创时代专利代理事务所(普通合伙) 43249 | 代理人: | 贾庆 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 记录 习题 相似 计算 推荐 方法 | ||
1.一种基于用户记录的习题相似度计算推荐方法,其特征在于,包括以下步骤:
步骤一、将每一个习题作为一个语句进行分词处理,得到习题中分词的词嵌入向量,再将每个习题所有词的词嵌入向量按照习题中词语出现的先后语序连接为一个矩阵,得到代表习题信息的习题矩阵,使用卷积神经网络模型对习题矩阵进行处理:卷积神经网络模型采用不同尺寸的过滤器进行卷积,得到多个输出特征,将输出特征的结果进行池化处理,拼接为一个向量vector1;
步骤二、将习题作为一个整体,计算习题之间的相似度:将习题本身作为一个词,将各个用户一次做过的习题的集合作为一个句子;计算两个习题在同一习题的集合中同时出现的概率作为两个习题的相似度;最终得到每个习题本身的嵌入向量,即向量vector2;
用skip-gram网络模型得到每个习题的嵌入向量:首先将用户一次练习中所做的习题作为一个集合,设用户一次练习中所做的习题数量为S,习题分别为W1,W2,W3……WS;选中当前目标习题Wi,使用skip-gram网络模型输出和当前目标习题Wi在一个习题集合共现的其他习题即正样本;模型的训练要使得在所有习题集合中目标习题Wi与用户一次练习中其余习题两两共现的条件概率最大,即最大;
其中,
其中ui是目标习题Wi的向量,vj是和目标习题Wi同时出现在集合中的习题的向量;I代表包含所有习题的题库;k表示输入题库的习题;Wj表示在用户一次练习的习题中与目标习题Wi不同的习题;
运用负采样的方法,即随机抽取多个与目标习题Wi不在同一集合的习题即负样本来进行输出的优化,降低模型的训练计算量;最终得到习题本身的嵌入向量表达:向量vector2;
步骤三、将vector1和vector2拼接得到最终的向量vector,通过向量vector进行训练得到训练好的模型:将向量vector1和向量vector2拼接得到最终的向量vector,将向量vector输入到一个全连接的神经网络中,然后通过最终的向量vector进行学习训练:以同一类型习题作为一个训练集合,若干训练集合作为一个训练集,输入目标习题,期望输出的习题为和目标习题属于同一类型习题的其他习题,使得输出为与前目标习题是同一类型的其他习题的概率最大,与当前目标习题不是同一类型的其他习题的计算出来的概率最小,得到训练好的模型;
步骤四、向训练好的模型输入用户所做的最近一个习题,输出结果为题库中所有习题对应用户所做的习题是同一类别的概率即为推荐概率,对结果中所有的习题的概率进行排序处理,选取推荐概率最大的a个用户还未做过的习题展示给用户完成推荐任务;a为设定的习题推荐数。
2.如权利要求1所述的基于用户记录的习题相似度计算推荐方法,其特征在于,所述步骤一包括如下步骤:
步骤一、使用第三方库jieba中文分词组件对每个习题进行分词,对得到的分词使用word2vec的skip-gram网络模型进行训练,将习题中的每个词映射成一个d维词向量,将每个习题中所有分词的词向量按照在习题中的语义顺序进行连接,得到一个代表习题矩阵;取词数最大的习题,词数为n;将每个习题处理为n*d矩阵,词数小于n的习题进行补0操作,使得输入的数据保持维度一致;使用卷积模型学习习题矩阵,设置2*d,3*d,5*d三个尺寸且每个尺寸分别使用三个过滤器进行卷积操作,将输出特征进行最大池化操作;将处理的九个输出特征的结果拼接成一个包含习题语义信息的向量vector1。
3.如权利要求1所述的基于用户记录的习题相似度计算推荐方法,其特征在于,训练的过程中采用负采样的方法进行加速训练,即对于一个目标习题的输入,随机抽取出e个并非和目标习题出现在同一集合的习题即负样本来对参数的更新过程进行优化,减小计算量,加快网络的训练速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444120.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种优秀教材匹配系统及其工作流程
- 下一篇:一种法律数据智能推送方法及系统