[发明专利]一种大数据架构下的医学领域自媒体平台数据推送方法有效
申请号: | 201710200819.6 | 申请日: | 2017-03-30 |
公开(公告)号: | CN107423320B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 纪俊;喻海清;于滨 | 申请(专利权)人: | 青岛大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/21;G06F16/2458 |
代理公司: | 深圳舍穆专利代理事务所(特殊普通合伙) 44398 | 代理人: | 黄贤炬 |
地址: | 266000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 架构 医学 领域 媒体 平台 推送 方法 | ||
本发明提供一种大数据架构下的医学领域自媒体平台数据推送方法,其包括以下步骤:步骤1:数据选择与转化;从用户行为日志信息中抽取有效数据,转化为建模数据矩阵;步骤2:构建评估数据矩阵;从建模数据矩阵筛选出符合评估推荐模型健壮性的评估数据矩阵;步骤3:推荐模型构建与评价;步骤4:组合形成推荐结果。本发明将医学领域自媒体平台相关数据进行系统的分析、建模,并给出模型预测的评价方法,通过该模型能够基于医学领域自媒体平台数据,对医生阅读进行有效的推荐,使医生在登录平台时实时获取相关文献,为达到最佳阅读选择提供依据。
技术领域
本发明涉及大数据应用技术领域,具体地说,涉及一种大数据架构下的医学领域自媒体平台数据推送方法。
背景技术
医学领域自媒体平台作为一种为医生服务的新型自媒体,目标是给注册医生用户提供最新的专业领域资讯,同时也给医生用户提供相互交流学习的平台,因此不但内容庞杂,而且信息量也比较大,如何更好的组织内容,对医生用户形成更好的黏性,是急需解决的实际问题。
精确了解医生的需求,同时引导医生的行为和媒体自身的目标更好的契合,是医学领域自媒体平台努力的方向。推荐算法发展到今天,可以分类为大众行为的推荐和个性化推荐。目前平台推荐系统首先对用户点击阅读内容进行统计和推荐建模,然后有计划的安排一些线上线下活动,最后根据统计结果和活动内容进行大众化推荐和个性化推荐相结合的混合推荐。
目前基于统计的推荐模型简单,结果容易掌控,但是内容相对滞后,不能有效利用平台产生的大量医生行为数据,提高模型性能和准确度。
发明内容
为解决以上问题,本发明提供的一种基于医学领域自媒体平台医生阅读文献数据的推荐方法。本专利采用大众行为推荐的模式并结合个性化推荐中的协同过滤算法,在数据处理和算法运用方面做了大量的改进,将其在Hadoop+Spark架构实施,达到了更好为平台服务的目的,其具体的技术方案如下:
一种大数据架构下的医学领域自媒体平台数据推送方法,其包括以下步骤:
步骤1:数据选择与转化;从用户行为日志信息中抽取可供建模的有效数据,并将这种流式数据转化为用户、时间、标签集合为列展开的建模数据矩阵;
步骤2:构建评估数据矩阵;为了降低数据矩阵的稀疏性,从建模数据矩阵筛选出符合评估推荐模型健壮性的评估数据矩阵;
(2.1)行过滤数据,即统计某用户某月阅读标签的个数,根据设定的阈值决定是否过滤掉某行数据;
(2.2)列过滤数据,即统计某标签阅读次数,根据设定的阈值决定是否过滤掉某列数据;
步骤3:推荐模型构建与评价,其步骤如下:
(3.1)依据阅读记录中的时间字段,将建模数据矩阵分割为训练集Xtrain、测试集Xtest,测试集为当月数据,训练集包含当月之前三个月的数据;
(3.2)使用改进基于物品的协同过滤推荐算法在训练集上建模;
(3.3)根据推荐模型按列对当月数据进行循环迭代推荐预测,得到所有用户所有标签的推荐矩阵Xrecomd;
(3.4)类似(3.1)~(3.3)步骤,对评估数据矩阵进行相同的处理,得到推荐矩阵X1recomd;
(3.5)设定阈值t_,对评估数据矩阵以及对应的推荐矩阵X1recomd进行0-1化处理,计算敏感度,特异度指标,选出稳定的大众化整体最优标签池TagPool;
步骤4:组合形成推荐结果,其步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛大学,未经青岛大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710200819.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高能离子除臭净化设备
- 下一篇:适用大批量小文件云存储的方法及其装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置