[发明专利]一种就业数据的协同过滤方法及系统在审
申请号: | 201810447336.0 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108681581A | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 胡方霞;蔡茜;朱军;张忠宇 | 申请(专利权)人: | 重庆工商职业学院;四川华迪信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都帝鹏知识产权代理事务所(普通合伙) 51265 | 代理人: | 黎照西 |
地址: | 400000 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 就业数据 偏好 群组 协同过滤 关联度 用户历史行为数据 目标用户 用户历史 用户推荐 维度 浏览 挖掘 发现 | ||
本发明公开一种就业数据的协同过滤方法及系统,获取用户历史浏览的就业数据;根据不同用户就业数据中相同维度的态度和偏好程度,计算用户之间的关联度;根据用户间的关联度,对不同偏好的用户进行群组划分;将同一群组内用户的就业数据评分后,推荐给群组内目标用户。本发明通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐偏好相似的就业数据,能够自主向相同偏好用户推荐相应的就业数据,能够有效提高就业数据推荐的精度和计算速率。
技术领域
本发明属于数据处理技术领域,特别是涉及一种就业数据的协同过滤方法及系统。
背景技术
随着信息及互联网技术的不断涌现,人们正面临着日益严重数据膨胀问题;信息推荐系统能够帮助人们在互联网巨大而繁杂的信息中找到自己感兴趣的信息。
尤其是在就业系统中,由于就业数据非常的巨大且复杂,用户想要找到自己需要的就业信息十分的费时费力,而且现有系统无法实现自主推荐,需要用户自己去查找。
现有的信息推荐系统采取协同过滤方式;协同过滤是在海量数据中挖掘出小部分与目标用户品味类似的用户。所以协同过滤就有如下两个核心问题:如何确定一个用户是否与目标用户有相似的品味,如何将相似用户的喜好组织推荐给目标用户;但是现有的协同过滤无法高效的获取到相似品味的用户,并且无法高效的将喜好组织推荐给目标用户,推荐的精度差且计算速率低。
发明内容
为了解决上述问题,本发明提出了一种就业数据的协同过滤方法及系统,通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐偏好相似的就业数据,能够自主向相同偏好用户推荐相应的就业数据,能够有效提高就业数据推荐的精度和计算速率。
为达到上述目的,本发明采用的技术方案是:一种就业数据的协同过滤方法,包括步骤:
S100获取用户历史浏览的就业数据;
S200根据不同用户就业数据中相同维度的态度和偏好程度,计算用户之间的关联度;
S300根据用户间的关联度,对不同偏好的用户进行群组划分;
S400将同一群组内用户的就业数据评分后,推荐给群组内目标用户。
进一步的是,所述步骤S100中,根据词法分析自然语言简略处理和专业技能分词算法在历史浏览信息中提取就业数据;能够从用户的网页浏览和录入数据提取出其中的就业数据。
进一步的是,为了高效的确定用户之间精确的关联度,所述步骤S200中,计算用户之间的关联度包括步骤:
S201计算用户就业数据的皮尔逊相关系数;
S202根据皮尔逊相关系数获得用户间关联的强弱程度。
进一步的是,为了高效的进行用户推荐提供基础,缩小用户推荐范围,所述步骤S300中,对用户进行群组划分包括步骤:通过维度归类,对不同偏好的用户进行群组划分。
进一步的是,为了高效且更加精确的向用户进行偏好的就业信息的自主推荐,所述步骤S400中,就业信息的推荐过程包括步骤:
S401对不同就业数据的评分进行相似度加权;
S402按加权后的推荐系数对就业信息进行排序,然后推荐给目标用户;
S403目标用户获得偏好相似的其他用户的就业数据。
进一步的是,所述就业信息的推荐过程为:
设定每个用户对每个就业数据的评分为aij,每个用户和目标用户的相似度为bj;
则每个就业数据的推荐系数为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工商职业学院;四川华迪信息技术有限公司,未经重庆工商职业学院;四川华迪信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810447336.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于链接预测的服务组合推荐方法
- 下一篇:一种数据管理方法及系统