[发明专利]一种基于关键词解析的试题网络排重检索办法有效
申请号: | 201810679402.7 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109241395B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 许楚平 | 申请(专利权)人: | 广州市南方人力资源评价中心有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06F40/289 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键词 解析 试题 网络 检索 办法 | ||
本发明公开了一种基于关键词解析的试题网络排重检索办法,具体包括以下步骤:文本字数判断、文本智能分词、提取关键词、截取文本、生成关键词列表、网络排重、原题与排重结果进行相似度分析,排重结果自定义排序展示步骤完成试题网络排重检索,本发明通过关键词提取后再进行网络排重,有效保护了原创试题,降低试题的泄露风险,并且通过排重结果的相似度分析,为用户提供更加高效的试题排重方法。
技术领域
本发明属于试题排重技术领域,更具体地说,尤其涉及一种基于关键词解析的试题网络排重检索办法。
背景技术
随着考试业务的不断扩大发展,试题是题库系统中的重要资源,特别是原创试题,是独一无二的资源,需重点保护。在实际使用过程中,所有试题都必须经过网络排重,才能确定试题的唯一性。现有方式是直接拿原题在百度或Google中进行网络排重,但是在这个过程中,一定程度上相当于把可能的原创试题暴露到互联网中,造成原创试题的泄露。
因此,我们需要提出一种有效保护了原创试题,降低试题的泄露风险的基于关键词解析的试题网络排重检索办法。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于关键词解析的试题网络排重检索办法。
为实现上述目的,本发明提供如下技术方案:
一种基于关键词解析的试题网络排重检索办法,具体包括以下步骤:
S1、文本字数判断:将需要排重的文本进行字数统计,并进行判断,以文本字数超过500字为依据将文本分为两类;
S2、文本智能分词:当步骤S1中的文本字数被判断为不超过500字时,采用IK-Analyzer对文本进行智能分词,并统计词频;
S3、提取关键词:将完成步骤S2的文本中的分词进行分析,提取主要关键词;
S4、截取文本:当步骤S1中的文本字数被判断为超过500字时,随机截取10段38字的文本;
S5、生成关键词列表:将完成步骤S3的关键词或完成步骤S4截取的文本提取关键词,生成关键词列表;
S6、网络排重:通过词频和自定义考试业务关键词,对分词结果进行自动分析,生成关键词信息,并默认提取最主要的15个关键词进行网络排重;
S7、原题与排重结果进行相似度分析:把原题和排重结果进行相似度分析,计算出相似度数值;
S8、排重结果自定义排序展示:用户可选择相似度排序或网络原始排序,进行结果展示。
优选的,所述步骤S1中提到的文本分为两类,一类为超过500字的文本,另一类为不超过500字的文本。
优选的,所述步骤S2中提到的IK-Analyzer,所述IK-Analyzer是一个开源的,基于Java语言开发的轻量级的中文分词工具包。
优选的,所述S3以及S5中提到的关键词为出题人设置的主要知识点关键词,在题库系统中,每一道试题都有所属的测评要素。
优选的,所述S4中提到的截取10段38字的文本,38个字是网络排重支持的最长长度,在排重时,也可以选择30至38区间的字数进行截取,且此文本字数长度不超过试题总长度的20%。
优选的,所述S5中提到的生成关键词列表,测评要素关键词结合智能分词关键词,如果智能分词关键词中存在于测评要素关键词,则优先提取,并按词频排序,词频高的排在前面,其余的智能分词关键词同样按词频紧随着排在后面。
优选的,所述S6中提到的默认提取最主要的15个关键词进行网络排重,其中15个关键词为关键词表中默认排序前15个关键词,用户也可根据需要选取其他关键词进行搜索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市南方人力资源评价中心有限公司,未经广州市南方人力资源评价中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810679402.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在线查询系统
- 下一篇:一种规避空气中过敏原的目的地选择方法和装置