[发明专利]一种学术画像模型的构建方法及装置在审
申请号: | 201910163197.3 | 申请日: | 2019-03-05 |
公开(公告)号: | CN109933699A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 谢靖;孔贝贝;钱力;师洪波 | 申请(专利权)人: | 中国科学院文献情报中心 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 画像 标签层 科研 构建 数据归纳 数据信息 原始数据 粗粒度 抽取 服务策略 获取信息 技术效果 科研活动 模型构架 应用决策 用户聚类 用户群体 资源服务 精准度 科研成果 分析 输出 支撑 制定 | ||
本发明公开了一种学术画像模型的构建方法及装置,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,进而建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层和数据归纳分析标签层;根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。达到了提升用户在资源服务平台中获取信息的精准度,并实现用户聚类,且针对不同用户群体,制定不同服务策略的技术效果。
技术领域
本申请涉及用户数据分析技术领域,尤其涉及一种学术画像模型的构建方法及装置。
背景技术
科研人员用于科研的文献种类众多,文献资源的增长速度飞快,可供用户使用的相关文献也很多,通过对用户画像信息的构建,分析用户兴趣及兴趣之间的关联关系,改变当前资源服务平台的服务模型由被动为主动,提供更加满足用户需求的文献资源。其中,用户画像是在用户完整信息的基础上,勾画目标用户喜好、用户诉求、潜在意愿,是一种产品设计与精准服务方向的有效工具,用户画像在各领域都已得到广泛的应用。比如,商业服务系统亚马逊、淘宝、京东等根据用户购买及浏览行为,构建用户商业行为个人画像,进而实现商品的推荐。
但本申请发明人在实现本申请实施例中技术方案的过程中,发现上述现有技术至少存在如下技术问题:
现有技术中互联网平台偏向于从日志行为中构建用户画像,由于日志行为数据稀疏,缺少多维度数据关联,维度分析不完整,标签体系粒度不精细,从而造成用户画像不完整不精准的技术问题。
本申请实施例通过提供一种学术画像模型的构建方法及装置,用以解决现有技术中互联网平台偏向于从日志行为中构建用户画像,由于日志行为数据稀疏,缺少多维度数据关联,维度分析不完整,标签体系粒度不精细,从而造成用户画像不完整不精准的技术问题。通过构建多维度的科研用户画像模型,达到了提升用户在资源服务平台中获取信息的精准度,并实现用户聚类,且针对不同用户群体,制定不同服务策略的技术效果。
为了解决上述问题,第一方面,本申请实施例提供了一种学术画像模型的构建方法,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。
优选的,所述用户原始数据层包括:所述科研用户的基本信息维度数据;所述科研用户的科研活动行为日志数据;所述科研用户的产出科研成果数据;所述科研用户的补充数据。
优选的,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层,包括:根据所述科研用户原始数据层中的行为日志数据,采用统计分析方法,获得所述科研用户的初步标签聚类;根据所述科研用户的初步标签聚类,完成定量标签计算,建立粗粒度抽取标签层。
优选的,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层,包括:对所述科研用户的原始数据层进行统计分析,获得所述标签库中标签数据的权重值;根据所述标签数据和所述标签的权重值,完成定性标签计算,建立数据归纳分析标签层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院文献情报中心,未经中国科学院文献情报中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910163197.3/2.html,转载请声明来源钻瓜专利网。