[发明专利]题库生成方法、服务器及计算机可读存储介质有效
申请号: | 201711130606.7 | 申请日: | 2017-11-15 |
公开(公告)号: | CN107943881B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/253;G06F40/284;G06Q10/10 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 于志光;郭梦霞 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 题库 生成 方法 服务器 计算机 可读 存储 介质 | ||
1.一种题库生成方法,应用于服务器,其特征在于,所述方法包括:
获取招聘网站的招聘职位描述信息;
将所述职位描述信息转换成具有完整信息的事实句;
将所述事实句按照问题生成模板生成行业问题;
将所述行业问题按照行业分类存储,以生成不同行业的题库;
所述将所述职位描述信息转换成具有完整信息的事实句的步骤,具体包括如下步骤:
将所述职位描述信息的各个词语单独归为一类;
根据所述词语之间的亲疏程度,将最可能指代同一实体的词语结合在一起;
以逐次聚合的方式将词语聚类,进而分离成几个具有完整信息的事实句。
2.如权利要求1所述的题库生成方法,其特征在于,所述将所述事实句按照问题生成模板生成行业问题,具体包括:
将所述事实句分解成树状的语法结构,以分析得到事实句的语法树;
解析所述语法树,得到问题的主体部分;
调取所述服务器预存储的问题生成模板;
将所述问题的主体部分匹配所述问题生成模板,生成行业问题。
3.如权利要求2所述的题库生成方法,其特征在于,所述调取所述服务器预存储的问题生成模板,匹配所述问题的主体部分,生成行业问题的步骤之后,还包括如下步骤:
构建标注样本深度学习的文本分类模型;
利用所述标注样本深度学习的文本分类模型检查所述行业问题是否通顺;
如果所述行业问题语句不通顺,所述标注样本深度学习的文本分类模型调整所述行业问题。
4.如权利要求1所述的题库生成方法,其特征在于,所述将所述行业问题按照行业分类存储,以生成不同行业的题库的步骤,具体包括如下步骤:
构建term frequency–inverse document frequency(TFIDF)模型;
利用所述TFIDF模型检查所述行业问题在所述题库中是否已经存在类似的问题;
若已经存在类似的行业问题,删除当前生成的所述行业问题。
5.如权利要求1-3任一项所述的题库生成方法,其特征在于,所述题库生成方法还包括如下步骤:
提取所述职位描述的关键词;
扩展出与所述关键词有关的相关词;
根据所述相关词生成行业问题。
6.一种服务器,其特征在于,所述服务器包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的题库生成系统,所述题库生成系统被所述处理器执行时实现如下步骤:
获取招聘网站的招聘职位描述信息;
将所述职位描述信息转换成具有完整信息的事实句;
将所述事实句按照问题生成模板生成行业问题;
将所述行业问题按照行业分类存储,以生成不同行业的题库;
所述将所述职位描述信息转换成具有完整信息的事实句的步骤,具体包括如下步骤:
将所述职位描述信息的各个词语单独归为一类;
根据所述词语之间的亲疏程度,将最可能指代同一实体的词语结合在一起;
以逐次聚合的方式将词语聚类,进而分离成几个具有完整信息的事实句。
7.如权利要求6所述的服务器,其特征在于,所述将所述事实句按照问题生成模板生成行业问题,具体包括:
将所述事实句分解成树状的语法结构,以分析得到事实句的语法树;
解析所述语法树,得到问题的主体部分;
调取所述服务器预存储的问题生成模板;
将所述问题的主体部分匹配所述问题生成模板,生成行业问题。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有题库生成系统,所述题库生成系统可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-5中任一项所述的题库生成方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711130606.7/1.html,转载请声明来源钻瓜专利网。