[发明专利]一种相似题目推荐系统和方法在审
申请号: | 202210489847.5 | 申请日: | 2022-05-07 |
公开(公告)号: | CN114817545A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 张学忠;王冠;杨根科;褚健 | 申请(专利权)人: | 上海交通大学宁波人工智能研究院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06K9/62 |
代理公司: | 上海剑秋知识产权代理有限公司 31382 | 代理人: | 徐浩俊 |
地址: | 315012 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似 题目 推荐 系统 方法 | ||
1.一种相似题目推荐系统,其特征在于,包括:
输入模块,输入题目,题目包括原始待推荐题目、原始待选题目及所述原始待选题目的知识点标签;
题目预处理模块,把所述原始待推荐题目和所述原始待选题目预处理为统一的规范格式,分别得到待推荐题目和待选题目;
题目储存模块,存储所述待选题目及所述知识点标签;
知识点预测模块,使用所述待选题目训练知识点预测模型,使用所述知识点预测模型对所述待推荐题目的知识点进行预测,根据预测得到的知识点读取所述题目储存模块中对应知识点标签的候选题目作为候选题目;
文本表示白化处理模块,将所述知识点预测模块输出矩阵变为一个均值为0、协方差矩阵为单位阵的矩阵;
文本对比学习模块,使用对比学习的方法训练文本表示,使用监督学习的方法构造正负样本,将同一知识点下的待选题目作为正样本,将不同知识点标签下的待选题目作为负样本,得到文本表示;
图片对比学习模块,使用对比学习的方法训练图片表示,分别使用图像变换和同一知识点下的待选题目构造正样本,不同知识点下的待选题目作为负样本,得到图片表示;
相似度计算模块,计算所述待推荐题目和所述候选题目之间的余弦相似度;
去重模块,输入所述待推荐题目、所述候选题目和所述余弦相似度,根据去重策略去除与所述待推荐题目相同的待选题目,得到相似题目;
输出模块,输出所述相似题目;
所述题目预处理模块分别连接所述输入模块、所述题目储存模块、所述知识点预测模块、所述文本对比学习模块和所述图片对比学习模块,响应于所述输入模块输入的所述原始待选题目及其知识点标签,预处理后得到所述待选题目,然后把所述待选题目和所述知识点标签写入所述题目储存模块;响应于所述输入模块输入的所述原始待推荐题目,预处理后得到所述待推荐题目,并发送到所述知识点预测模块;响应于所述待推荐题目,所述知识点预测模块预测知识点,根据预测得到的知识点读取所述题目储存模块对应知识点标签下的待选题目得到候选题目,然后在所述文本表示白化处理模块做白化处理;所述待推荐题目在所述文本对比学习模块训练文本表示;所述待推荐题目在所述图片对比学习模块训练图片表示;白化处理的结果与所述文本表示、所述图片表示共同输入所述相似度计算模块计算相似度,并通过所述去重模块去重得到相似题目,然后把所述相似题目通过所述输出模块输出。
2.如权利要求1所述的相似题目推荐系统,其特征在于,所述预处理包括将超文本标记语言移除,将不规范的表示转化成Latex格式,对希腊字母、罗马数字转化为统一的字母题目表示。
3.如权利要求1所述的相似题目推荐系统,其特征在于,所述知识点预测模型使用编码器-解码器的结构。
4.如权利要求3所述的相似题目推荐系统,其特征在于,所述知识点预测模型设置12层编码器层和12层解码器层。
5.如权利要求1所述的相似题目推荐系统,其特征在于,所述知识点预测模块使用随机初始化权重对所述知识点预测模型进行训练,输入为待选题目,输出为待选题目的知识点,训练好之后保存知识点预测准确度最高的权重文件。
6.如权利要求1所述的相似题目推荐系统,其特征在于,所述去重策略为:使用编辑距离衡量待推荐题目和候选题目在文字上的相似程度,计算所述候选题目与所述待推荐题目的编辑距离,并设定重复阈值,如果所述编辑距离小于所述重复阈值,则认为所述候选题目与所述待推荐题目相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学宁波人工智能研究院,未经上海交通大学宁波人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210489847.5/1.html,转载请声明来源钻瓜专利网。