[发明专利]一种面向档案数据的人才与政策智能匹配系统和方法在审
申请号: | 201910701445.5 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110457696A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 黄丽丽;游河仁;卢佩;石宝玉;姚智振 | 申请(专利权)人: | 福州数据技术研究院有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/951;G06F16/335;G06F16/35;G06K9/20;G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 35211 福州君诚知识产权代理有限公司 | 代理人: | 戴雨君<国际申请>=<国际公布>=<进入 |
地址: | 350000福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息库 政策数据库 人事档案 抽取 政策 量化指标 匹配结果 推送 申报 匹配 条件随机场模型 结构化存储 档案数据 电子文件 关键信息 基于事件 价值信息 扫描识别 项目信息 语义单元 智能匹配 构建 纸质 字段 剔除 采集 筛选 输出 吸引 | ||
1.一种面向档案数据的人才与政策智能匹配方法,其特征在于:其包括以下步骤;
步骤1,获取本地人才纸质人事档案并扫描为图像,并利用图像识别技术将所扫描的图像转换成可编辑的电子文件,形成人事档案信息库;
步骤2,基于人事档案信息库采用基于事件抽取的条件随机场模型抽取有价值信息并结构化存储形成人才信息库;
步骤3,采集获取当前的人才政策构建人才政策数据库;
步骤4,基于人工规则的政策语义单元抽取方法对人才政策数据库的人才政策关键信息进行抽取得到可量化指标信息;
步骤5,将人才政策数据库中的可量化指标信息与人才信息库中的字段进行匹配获取所有人才信息库中的人才与政策匹配结果,
步骤6,从匹配结果筛选综合匹配程度分值高的政策项目剔除以已申报的人才向为报名的人才推送政策并展现项目信息。
2.根据权利要求1所述的一种面向档案数据的人才与政策智能匹配方法,其特征在于:步骤1的具体步骤为:
步骤1.1,将纸质人事档案用扫描的方式录入电脑,保存为图像;
步骤1.2,应用OCR技术将图像分为几个子图像,每个子图像中包含一个单独的字母;
步骤1.3,将子图像从图像格式转换成二进制格式,并将二进制数据传输到BP神经网络;
步骤1.4,BP神经网络通过训练过程找出字符图像数据和数值之间的关联,将所扫描的图像转换成可编辑的电子文件,并识别结果进入到系统数据库。
3.根据权利要求1所述的一种面向档案数据的人才与政策智能匹配方法,其特征在于:步骤2运用条件随机场模型对人事档案信息进行事件抽取的具体步骤为:
步骤2.1,人事档案信息的档案文本进行分词处理将文档表示成tf/idf加权的向量,
步骤2.2,采用基于文档频率的方法进行特征提取,过滤掉对于正确分类贡献低的单词;
步骤2.3,设置档案文本训练集,完成档案文本训练集到特征集合的转换,并通过人工标注标签对特征分类进行学习;
步骤2.4,将档案文本测试集得到相同类型特征集合,然后通过分类器模型判别得到对应的分类标签,进行结构化存储建立人才信息库。
4.根据权利要求3所述的一种面向档案数据的人才与政策智能匹配方法,其特征在于:步骤2.1的档案文本通常包括个人基本信息、教育背景、工作经历和论文专利发表情况。
5.根据权利要求1所述的一种面向档案数据的人才与政策智能匹配方法,其特征在于:步骤3的人才政策获取方式包括导入方式和提取方式,导入方式指政府机构或第三方机构主动将政策信息编辑存入人才政策数据库;提取方式是指利用机器人、网络爬虫、网络蜘蛛的网络搜索工具对选定的目标政府网站中所有与人才相关联的政策信息进行自动采集并下载至本地服务器再整理存入人才政策数据库。
6.根据权利要求1所述的一种面向档案数据的人才与政策智能匹配方法,其特征在于:步骤4具体包括政策词库构建、政策文本预处理和政策信息抽取三个步骤,具体为:
政策词库构建:包括人才政策词典和触发词,人才政策词典由按政策类型、政策名称、适用条件和关键词的分类条件对人才政策数据库的词汇进行收录;触发词用于触发抽取任务,触发词为对语义单元的起着识别、标志作用的词语,触发词通过对本地人才政策语料库的文本特征和描述习惯进行分析提取得到;
政策文本预处理:使用中科院 ICTCLAS 分词工具进行分词并标注词性;
政策信息抽取: 基于触发词表制定抽取规则,并使用正则表达式描述抽取规则建立规则库,最后进行本地人才政策的语义单元的抽取并存入人才政策数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州数据技术研究院有限公司,未经福州数据技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910701445.5/1.html,转载请声明来源钻瓜专利网。