[发明专利]一种学术画像模型的构建方法及装置在审
申请号: | 201910163197.3 | 申请日: | 2019-03-05 |
公开(公告)号: | CN109933699A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 谢靖;孔贝贝;钱力;师洪波 | 申请(专利权)人: | 中国科学院文献情报中心 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 画像 标签层 科研 构建 数据归纳 数据信息 原始数据 粗粒度 抽取 服务策略 获取信息 技术效果 科研活动 模型构架 应用决策 用户聚类 用户群体 资源服务 精准度 科研成果 分析 输出 支撑 制定 | ||
1.一种学术画像模型的构建方法,其特征在于,所述方法包括:
获得科研用户与参加的科研活动、产出科研成果相关的数据信息;
根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;
根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;
根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;
根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;
根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;
通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。
2.如权利要求1所述的方法,其特征在于,所述用户原始数据层包括:
所述科研用户的基本信息维度数据;
所述科研用户的科研活动行为日志数据;
所述科研用户的科研成果产出数据;
所述科研用户的补充数据。
3.如权利要求1所述的方法,其特征在于,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层,包括:
根据所述科研用户原始数据层中的基本信息、科研行为日志、科研成果产出数据,采用统计分析方法,获得所述科研用户的初步标签聚类;
根据所述科研用户的初步标签聚类,完成定量标签计算,建立粗粒度抽取标签层。
4.如权利要求1所述的方法,其特征在于,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层,包括:
对所述科研用户的原始数据层进行统计分析,获得所述标签库中标签数据的权重值;
根据所述标签数据和所述标签的权重值,完成定性标签计算,建立数据归纳分析标签层。
5.如权利要求1所述的方法,其特征在于,所述根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层,包括:
根据所述标签数据,通过K-means无监督学习算法,对所述科研用户的标签数据进行分类预测;
获得所述分类预测的输出结果;
根据所述输出结果,建立所述应用决策支撑标签层。
6.如权利要求5所述的方法,其特征在于,所述通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像,包括:
将所述输出结果作为所述多级科研用户学术画像模型的输入数据,通过多维度json概率模型输出格式,通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像;
将所述科研用户的学术画像按照时间片段进行归类存储,获得不同时期的用户画像文件,包括用户的长期全景画像和短期兴趣画像。
7.一种学术画像模型的构建装置,其特征在于,所述装置包括:
第一获得单元,所述第一获得单元用于获得科研用户与参加的科研活动、产出科研成果相关的数据信息;
第一构建单元,所述第一构建单元用于根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;
第一建立单元,所述第一建立单元用于根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;
第二建立单元,所述第二建立单元用于根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;
第三建立单元,所述第三建立单元用于根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;
第四建立单元,所述第四建立单元用于根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;
第一输出单元,所述第一输出单元用于通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院文献情报中心,未经中国科学院文献情报中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910163197.3/1.html,转载请声明来源钻瓜专利网。