[发明专利]一种智库数据处理方法及系统在审
申请号: | 202110007029.2 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112685615A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 吴晓军;吴方同 | 申请(专利权)人: | 河北冀联人力资源服务集团有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/901 |
代理公司: | 北京艾皮专利代理有限公司 11777 | 代理人: | 马小辉 |
地址: | 050051 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 | ||
1.一种智库数据处理方法,其特征在于,所述方法包括:
步骤101,注册管理角色用户,所述角色包括第一角色、第二角色以及第三角色;
步骤102,区域智库服务端发送匹配请求;
步骤103,调度Agent模块接收匹配请求转发至需求大数据建模模块建模并发送至所述大数据推荐模块;
步骤104,大数据推荐模块接收需求大数据建模模块发送的二维第三角色树模型,实现树形模型匹配运算,获得智库推荐结果。
2.根据权利要求1所述的方法,其特征在于,在发送匹配请求之前还包括所述调度Agent模块还接收智库认证模块请求并发送至所述智库大数据建模模块,建立智库专家模型树,然后将结果返回至所述调度Agent模块,所述调度Agent模块将结果返回至智库认证模块;所述需求大数据建模模块定期对智库大数据库中存储的半结构化数据和未结构化数据大数据进行处理;所述智库大数据建模模块接收互联网智库数据和区域智库服务端数据,对互联网智库数据进行处理,建立数据体关联关系,将数据体与关系索引存储至智库大数据库,根据结构化数据建立二维第二角色树模型,分析结构化数据,对所述结构化数据设定分级权值,根据系数和所述分级权值将智库等级信息分级存储。
3.根据权利要求1所述的方法,其特征在于,所述树形模型匹配运算具体为,所述树形模型匹配运算具体为,采用交并相似性算法计算累加相似性比例,选取比例最高的前N个第二角色作为推荐对象,存储第二角色树模型节点文本及第三角色树模型节点文本,获取所述两文本相同的交集字符个数及集合并集字符个数,计算两文本集合数量差值,获得两节点文本最大长度,运算获得两文本节点按最大长度对齐后的文本字符串,通过遍历比较所述两文本节点获得编辑距离,定义字符矩阵储存字符长度比较结果,对第三角色树模型节点文本进行遍历,通过第三字符函数获取第s-1位的字符,对第二角色树模型节点文本进行遍历,通过第二字符函数获取第k-1位的字符,比较第二字符函数与第三字符函数函数值,如果相同则通过叠加记录长度,获取两节点文本最大的相同字符串长度,计算相似度。
4.根据权利要求3所述的方法,其特征在于,其中s为第三角色树模型节点文本长度,k为第二角色树模型节点文本长度,所述代入公式为:Simi = simi +[Inc/ (Uin+ AS ) *100+ZCC/(BYJ+ZCC)]/2,其中,BYJ为编辑距离,ZCC为两节点文本最大的相同字符串长度,Inc为交集,Uin为并集,As为待比较的两个字符串长度差值。
5.根据权利要求1所述的方法,其特征在于,所述需求大数据建模模块定期对智库大数据库中存储的半结构化数据和未结构化数据大数据进行处理具体为:对智库大数据库中存储的半结构化数据和未结构化数据大数据进行首次处理,清洗智库弱关联数据首次处理数据,对所述首次处理数据进行分词预处理去除低频次数据,自动分析数据之间关联关系,建立数据体关联关系,将数据体与关系索引存储至智库大数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北冀联人力资源服务集团有限公司,未经河北冀联人力资源服务集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110007029.2/1.html,转载请声明来源钻瓜专利网。