[发明专利]高质数据的挖掘方法、生产方法和系统在审
申请号: | 202011530665.5 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112559821A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 黄鹤南 | 申请(专利权)人: | 作业帮教育科技(北京)有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906;G06F16/907;G06Q50/20 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 喻颖 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 质数 挖掘 方法 生产 系统 | ||
1.一种高质数据的挖掘方法,其特征在于,包括如下步骤:
基于周期性特征,和/或,基于当前热点的相同簇或近似簇,来预估得到高质试题的相关数据信息。
2.根据权利要求1所述的方法,其特征在于,所述周期性特征是基于知识点的学期、学年信息,搜索试题与搜索人的学籍信息的周期性相关性,搜索试题的出现时机和频率来确定的。
3.根据权利要求1所述的方法,其特征在于,所述当前热点为系统根据搜索主题的相关辅助信息在试题库中检索到匹配的内容,从而映射得到的相关知识点信息。
4.根据权利要求1所述的方法,其特征在于,所述当前热点的相同簇或近似簇还基于题目的页面浏览量、题目的辅助信息和/或题目的相似簇来获得。
5.根据权利要求1所述的方法,其特征在于,所述当前热点的相同簇或近似簇还基于题目的辅助信息,匹配当前时间信息:所属学年、学季,重点考试,重点学科进度信息在试题库中进行检索匹配得到。
6.一种高质试题的生产方法,其特征在于,包括以下步骤:
采用如权利要求1-5中任一项所述的高质数据的挖掘方法来预估得到高质试题的相关数据信息;
对得到的高质试题的相关数据信息进行评估,判断是否需要进一步扩展生产;
如果需要,则组织生产。
7.根据权利要求6所述的方法,其特征在于,对需要进一步扩展生产的还需要根据其数据的生成来源进行时效性标记,将其分为高时效试题和低时效试题。
8.根据权利要求7所述的方法,其特征在于,在数据生产过程中,如果发现高时效试题超过时效性,会重新判断该题目是需要重投至低时效性生产,还是废弃生产。
9.根据权利要求6所述的方法,其特征在于,对需要进一步扩展生产的还根据题目的相同簇、完整度和/或丰富度信息,对在热题集中的题目进行打分。
10.根据权利要求6所述的方法,其特征在于,对于需要组织生产的以众包的模式分发给试题生产人员进行生产。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于作业帮教育科技(北京)有限公司,未经作业帮教育科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011530665.5/1.html,转载请声明来源钻瓜专利网。