首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种职位构图和自动聚类方法有效

申请号：	201910100896.3	申请日：	2019-01-31
公开（公告）号：	CN109829500B	公开（公告）日：	2023-05-02
发明（设计）人：	蔡毅;张建南;谢浩然	申请（专利权）人：	华南理工大学
主分类号：	G06F18/23213	分类号：	G06F18/23213;G06F18/15;G06F18/2323;G06F18/25;G06F16/901;G06Q10/1053
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍;江裕强
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种职位构图自动方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种职位构图和自动聚类方法，其特征在于，包括：

预定义的一套职位特征模板；

从招聘网站中收集半结构化的职位样本数据，提取特征信息填充职位特征模板；

从收集的半结构化的职位样本数据中提取公司类型信息；

利用网页链接信息构造职位网络；

对职位网络采用随机游走采样得到样本路径；

利用语言模型训练节点的分布式表示；

融合职位节点的分布式表示和特征模板上的特征信息作为职位特征；

采用K-means算法对职位样本进行聚类。

2.根据权利要求1所述的方法，其特征在于所述的预定义一套职位特征模板包括月薪、工作时长、工作经验、学历要求、英语水平要求、奖金水平、是否购买五险一金。

3.根据权利要求1所述的方法，其特征在于所述的从招聘网站中收集半结构化的职位样本数据，提取特征信息填充职位模板，包括：

对类别特征的缺失值填充“unknown”，对数值型特征的缺失值填充预定义的默认值；

使用箱型图和逻辑回归神经网络两种方法辨识和去除噪音；

使用z值法对数据标准化。

4.根据权利要求1所述的方法，其特征在于从收集的半结构化职位样本数据中提取公司类型信息，

若职位样本数据中有所属公司，则记录公司名称；若职位样本数据中还有所属公司的行业类别信息，则记录公司名称对应的行业类别属性，否则以“unknown”填充该公司名称的行业类别属性。

5.根据权利要求1所述的方法，其特征在于：所述的利用网页链接信息构造职位网络包括：

构造的职位网络为异形图，以职位以及公司作为节点；

利用招聘网页上的职位之间的链接信息、公司与职位之间的连接信息，公司与公司之间的链接信息构建节点之间边的权重。

6.根据权利要求1所述的方法，其特征在于随机游走算法以节点与该节点的邻接节点之间的边的权重作为从节点到该节点的邻接节点的采样概率。

7.根据权利要求1所述的方法，其特征在于利用语言模型训练训练节点的分布式表示中，

使用以长短期记忆网络（LSTM）作为基本单元的循环神经网络（RNN）作为语言模型。

8.根据权利要求1所述的方法，其特征在于所述融合职位节点的分布式表示和特征模板上的特征信息中，拼接使用语言模型学习得到的分布式表示以及职位模板中的特征值。

9.根据权利要求1所述的方法，其特征在于所述采用K-means算法进行聚类包括：

类的数量K由公司行业类别种类数量决定；K个聚类中心的初始值的分布式表示由对应行业类别的所有公司的分布式表示决定，特征值部分随机初始化。

10.根据权利要求1所述的方法，其特征在于所述语言模型采用神经语言模型，以长短期记忆网络（LSTM）作为基本单元的循环神经网络（RNN）实现。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910100896.3/1.html，转载请声明来源钻瓜专利网。

上一篇：基于同一特征空间的图文数据融合情感分类方法和装置
下一篇：图像处理方法及装置、电子设备和存储介质

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top