[发明专利]一种基于领域特征和隐语义分析的科技资源推荐方法在审
申请号: | 201510962244.2 | 申请日: | 2015-12-21 |
公开(公告)号: | CN105512323A | 公开(公告)日: | 2016-04-20 |
发明(设计)人: | 罗亮;林珠;方少亮;徐迪威;李海威;黄皓璇 | 申请(专利权)人: | 广东省科技基础条件平台中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510033 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 领域 特征 隐语 分析 科技 资源 推荐 方法 | ||
技术领域
本发明涉及科技资源数据处理领域,更具体地,涉及一种基于领域特征和隐语义 分析的科技资源推荐方法。
背景技术
知识时代,科技资源在国民经济发展中愈发重要,在科技活动中的共享和利用程 度也得到相关部门和企业的高度重视,资源的多维大数据特征得以突显。为改善科技创新 环境,为广大科技工作者和科技活动提供强有力的基础条件支撑,该专利研究科技资源推 荐方法,适用于科技资源共享平台和科技资源查询推荐系统,为科技资源使用者提供便利, 有效提高科技资源的利用率。
科技资源具有领域性强、数据分散、地域性强的特点,当前的通用性推荐算法(如 用户行为分析、协同过滤技术等)在实际的资源共享平台中的应用效果不佳,资源推荐准确 率偏低。隐语义分析技术是一种基于机器学习的一系列方法,具有比较好的理论基础,目前 部分算法在推荐系统中已经得到应用和肯定。但是,对于科技资源,目前尚无相关推荐模 型,也没有将领域与隐语义分析相结合的算法。
发明内容
本发明提供一种能够有效避免隐语义分析算法存在的冷启动问题的基于领域特 征和隐语义分析的科技资源推荐方法。
为了达到上述技术目的,本发明的技术方案如下:
一种基于领域特征和隐语义分析的科技资源推荐方法,包括以下步骤:
S1:通过对科技资源进行领域聚类,将用户和资源按领域进行有效分类,形得到用户领 域和资源领域,并进行预处理得到用户-用户领域数据集、用户领域-资源领域数据集、资源 领域-资源数据集;
S2:利用用户领域和资源领域建立基于领域特征和隐语义分析的推荐模型;
S3:获取用户的需求信息,通过建立的基于领域特征和隐语义分析的推荐模型为用户 推荐所需的资源。
进一步地,所述步骤S1的具体过程如下:
定义活跃用户、用户领域、资源领域、热点数据、关注数据、收藏数据、订单数据、日志数 据,采用去除稀疏数据,处理缺失值的数据处理技术,获得用户-用户领域数据集、用户领 域-资源领域数据集、资源领域-资源数据集。
进一步地,所述步骤S2的具体过程如下:
对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行初 始化,并分别对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集 进行训练得到用户领域矩阵P、资源领域矩阵Q和用户领域-资源领域矩阵L。
进一步地,所述步骤S2还包括:
通过计算公式L-LFM=P×L×Q,得到基于领域特征和隐语义分析的推荐算法模型(L- LFM)。
进一步地,得到用户领域矩阵P的过程如下:
将用户-用户领域数据集通过slope-one算法进行运算,形成用户领域矩阵P[u][j],并 获得P矩阵的相关参数。
进一步地,得到用户领域矩阵Q的过程如下:
将资源领域-资源数据集通过slope-one算法进行运算,形成资源领域矩阵Q[j][i],并 获得Q矩阵的相关参数。
进一步地,得到用户领域矩阵L的过程如下:
将用户领域-资源领域数据集通过slope-one算法进行运算,形成用户领域-资源领域 矩阵Q[i][s],并获得Q矩阵的相关参数。
本发明方法通过对科技资源进行领域聚类,将用户和资源的按领域进行有效分 类,形成用户领域和资源领域,再此基础上,建立引入领域矩阵的推荐模型,改善了隐语义 分析算法不太适用于资源数非常庞大的系统,有效提高推荐语义的可解释性。并且,科技资 源推荐不同于新闻推荐,对实时性要求不高,用户群体相对固定,因此,能够有效避免隐语 义分析算法存在的冷启动问题。
与现有技术相比,本发明技术方案的有益效果是:
本发明方法引入用户领域和资源领域,寻找更适合描述用户和资源的分类,更有利于 隐语义分析算法形成有意义的主题分类,改善了隐语义分析算法无法解释分类意义的现 象,同时首先运用高效快速的slope-one算法对三大数据集进行运算,形成P、L、Q矩阵,改善 了隐语义分析算法时间复杂度高的问题,适用于跨领域广、数据量庞大、用户群体相对固定 的科技资源推荐,有效地避免隐语义分析算法存在的冷启动问题。
附图说明
图1为本发明中基于领域特征和隐语义分析的推荐算法模型(L-LFM)的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省科技基础条件平台中心,未经广东省科技基础条件平台中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510962244.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于Hadoop的海量数据处理方法和装置
- 下一篇:页面生成方法和装置