[发明专利]一种基于关键词解析的试题网络排重检索办法有效
申请号: | 201810679402.7 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109241395B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 许楚平 | 申请(专利权)人: | 广州市南方人力资源评价中心有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06F40/289 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于关键词解析的试题网络排重检索办法,具体包括以下步骤:文本字数判断、文本智能分词、提取关键词、截取文本、生成关键词列表、网络排重、原题与排重结果进行相似度分析,排重结果自定义排序展示步骤完成试题网络排重检索,本发明通过关键词提取后再进行网络排重,有效保护了原创试题,降低试题的泄露风险,并且通过排重结果的相似度分析,为用户提供更加高效的试题排重方法。 | ||
搜索关键词: | 一种 基于 关键词 解析 试题 网络 检索 办法 | ||
【主权项】:
1.一种基于关键词解析的试题网络排重检索办法,其特征在于:具体包括以下步骤:S1、文本字数判断:将需要排重的文本进行字数统计,并进行判断,以文本字数超过500字为依据将文本分为两类;S2、文本智能分词:当步骤S1中的文本字数被判断为不超过500字时,采用IK‑Analyzer对文本进行智能分词,并统计词频;S3、提取关键词:将完成步骤S2的文本中的分词进行分析,提取主要关键词;S4、截取文本:当步骤S1中的文本字数被判断为超过500字时,随机截取10段38字的文本;S5、生成关键词列表:将完成步骤S3的关键词或完成步骤S4截取的文本提取关键词,生成关键词列表;S6、网络排重:通过词频和自定义考试业务关键词,对分词结果进行自动分析,生成关键词信息,并默认提取最主要的15个关键词进行网络排重;S7、原题与排重结果进行相似度分析:把原题和排重结果进行相似度分析,计算出相似度数值;S8、排重结果自定义排序展示:用户可选择相似度排序或网络原始排序,进行结果展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市南方人力资源评价中心有限公司,未经广州市南方人力资源评价中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810679402.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种在线查询系统
- 下一篇:一种规避空气中过敏原的目的地选择方法和装置