[发明专利]一种基于文本挖掘的课程设置分析方法在审
申请号: | 202110287512.0 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112861530A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 张建桃;曾莉;韦婷婷;江涛;张大斌;凌立文;毛小娟 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62;G06F16/215;G06F16/2458;G06F16/26;G06F16/951;G06Q50/20 |
代理公司: | 广州赤信知识产权代理事务所(普通合伙) 44552 | 代理人: | 龚素琴 |
地址: | 510630 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 挖掘 课程 设置 分析 方法 | ||
本发明公开了一种基于文本挖掘的课程设置分析方法,该方法包括:根据确定的数据搜索关键词,从选定的招聘网站中采集研究专业的招聘要求数据和非研究专业的招聘要求数据;对采集的招聘要求数据进行预处理操作;提取招聘要求数据中的知识点,并构建知识词库;对知识词库中的知识点进行聚类分析,并将分类后的知识点归类到课程,获得就业市场对该专业的课程需求。本发明利用文本挖掘技术获取就业市场对人才的知识要求,通过课程归类得到课程需求,无需大量耗费时间和人力进行调研就能快速获得合理的课程设置建议,能在各个专业领域进行快速应用推广,为高校课程设置的优化和改进提供决策支持。
技术领域
本发明涉及课程设置分析领域,特别是涉及一种基于文本挖掘的课程设置分析方法。
背景技术
目前我国高等教育正处于内涵发展、质量提升、改革攻坚的关键时期和全面提高人才培养质量、建设高等教育强国的关键阶段。课程设置是人才培养的重要环节,能够直接影响人才培养的质量。然而,当前高校的课程设置仍存在许多的不足,其中设置的课程不能很好的匹配就业市场需求的问题最为明显,以致于培养出来的专业人才无法适应行业发展的趋势和满足社会发展的需求,因此如何优化和改善高校的课程设置,使培养的人才更加符合就业市场的需求是一个重要的研究课题。
通过对文献的查阅与整理发现,目前人才的就业市场需求主要是通过统计调查、问卷调查、企业走访等传统的调研方式获得,样本数据较少,且需要耗费较多的时间和人力。文本挖掘是一种能从非结构化文本数据中提取有意义信息的技术。文本挖掘通过使用自然语言和文档处理技术提取上下文和含义,相比于传统的调研方式,能够快速、高效、智能化的获取更多潜在价值信息。据艾瑞网发布的《2020年中国网络招聘行业市场发展研究报告》,2019年网络招聘企业雇主数量已经达486.6万家,网络招聘已成为企业招聘的主要方式,采用文本挖掘技术挖掘网络招聘需求是获取就业市场需求是一个可行的途径。
发明内容
本发明的目的在于提供一种基于本文挖掘的课程设置分析方法,通过获取招聘网站中的招聘数据,分析就业市场对人才知识方面的要求,获得就业市场对该专业的课程需求,从而为高校的课程设置提供决策支持。
为实现上述目的,本发明所采用的技术方案是:
一种基于文本挖掘的课程设置分析方法,包括以下步骤:
步骤1:数据采集,根据确定的数据搜索关键词,从选定的招聘网站中采集研究专业的招聘要求数据和非研究专业的招聘要求数据;
步骤2:数据预处理,对采集的招聘要求数据进行预处理操作;
步骤3:知识点提取,提取招聘要求数据中的知识点,并构建知识词库;
步骤4:课程归类,对知识词库中的知识点进行聚类分析,并将分类后的知识点归类到课程,获得就业市场对该专业的课程需求。
优选的,所述的数据采集包括以下子步骤:
步骤1.1:制定采集规则,选定数据采集的招聘网站,确定研究专业的搜索关键词及非研究专业的搜索关键词、数据采集的网页页数、数据发布的时间段等;
步骤1.2:网络爬虫,根据制定的数据采集规则,通过网络爬虫技术爬取招聘网站中的招聘数据;
步骤1.3:采用正则表达式从获取的招聘数据中提取招聘要求字段的数据。
优选的,所述的数据预处理包括以下子步骤:
步骤2.1:数据清洗,对采集的数据进行数据清洗,清除数据中的空值、重复值、异常范值、HTML标签等数据噪声;
步骤2.1:构建自定义分词词典和停用词库,分词词典中包含研究专业领域的知识点词语,停用词库中包含无研究意义的词语;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287512.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种热自适应性模块、电池模组及电池包
- 下一篇:一种EGR阀在线检测平台