[发明专利]一种基于关键词解析的试题网络排重检索办法有效

专利信息
申请号: 201810679402.7 申请日: 2018-06-27
公开(公告)号: CN109241395B 公开(公告)日: 2021-08-03
发明(设计)人: 许楚平 申请(专利权)人: 广州市南方人力资源评价中心有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/33;G06F40/289
代理公司: 暂无信息 代理人: 暂无信息
地址: 510000 广东省广州市番禺区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 关键词 解析 试题 网络 检索 办法
【说明书】:

发明公开了一种基于关键词解析的试题网络排重检索办法,具体包括以下步骤:文本字数判断、文本智能分词、提取关键词、截取文本、生成关键词列表、网络排重、原题与排重结果进行相似度分析,排重结果自定义排序展示步骤完成试题网络排重检索,本发明通过关键词提取后再进行网络排重,有效保护了原创试题,降低试题的泄露风险,并且通过排重结果的相似度分析,为用户提供更加高效的试题排重方法。

技术领域

本发明属于试题排重技术领域,更具体地说,尤其涉及一种基于关键词解析的试题网络排重检索办法。

背景技术

随着考试业务的不断扩大发展,试题是题库系统中的重要资源,特别是原创试题,是独一无二的资源,需重点保护。在实际使用过程中,所有试题都必须经过网络排重,才能确定试题的唯一性。现有方式是直接拿原题在百度或Google中进行网络排重,但是在这个过程中,一定程度上相当于把可能的原创试题暴露到互联网中,造成原创试题的泄露。

因此,我们需要提出一种有效保护了原创试题,降低试题的泄露风险的基于关键词解析的试题网络排重检索办法。

发明内容

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于关键词解析的试题网络排重检索办法。

为实现上述目的,本发明提供如下技术方案:

一种基于关键词解析的试题网络排重检索办法,具体包括以下步骤:

S1、文本字数判断:将需要排重的文本进行字数统计,并进行判断,以文本字数超过500字为依据将文本分为两类;

S2、文本智能分词:当步骤S1中的文本字数被判断为不超过500字时,采用IK-Analyzer对文本进行智能分词,并统计词频;

S3、提取关键词:将完成步骤S2的文本中的分词进行分析,提取主要关键词;

S4、截取文本:当步骤S1中的文本字数被判断为超过500字时,随机截取10段38字的文本;

S5、生成关键词列表:将完成步骤S3的关键词或完成步骤S4截取的文本提取关键词,生成关键词列表;

S6、网络排重:通过词频和自定义考试业务关键词,对分词结果进行自动分析,生成关键词信息,并默认提取最主要的15个关键词进行网络排重;

S7、原题与排重结果进行相似度分析:把原题和排重结果进行相似度分析,计算出相似度数值;

S8、排重结果自定义排序展示:用户可选择相似度排序或网络原始排序,进行结果展示。

优选的,所述步骤S1中提到的文本分为两类,一类为超过500字的文本,另一类为不超过500字的文本。

优选的,所述步骤S2中提到的IK-Analyzer,所述IK-Analyzer是一个开源的,基于Java语言开发的轻量级的中文分词工具包。

优选的,所述S3以及S5中提到的关键词为出题人设置的主要知识点关键词,在题库系统中,每一道试题都有所属的测评要素。

优选的,所述S4中提到的截取10段38字的文本,38个字是网络排重支持的最长长度,在排重时,也可以选择30至38区间的字数进行截取,且此文本字数长度不超过试题总长度的20%。

优选的,所述S5中提到的生成关键词列表,测评要素关键词结合智能分词关键词,如果智能分词关键词中存在于测评要素关键词,则优先提取,并按词频排序,词频高的排在前面,其余的智能分词关键词同样按词频紧随着排在后面。

优选的,所述S6中提到的默认提取最主要的15个关键词进行网络排重,其中15个关键词为关键词表中默认排序前15个关键词,用户也可根据需要选取其他关键词进行搜索。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市南方人力资源评价中心有限公司,未经广州市南方人力资源评价中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810679402.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top