[发明专利]一种基于知识图谱的科学研究热点分析与预测方法有效
申请号: | 201910058235.9 | 申请日: | 2019-01-22 |
公开(公告)号: | CN109800288B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 张子柯;李丽霞;任卓明 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 科学研究 热点 分析 预测 方法 | ||
1.一种基于知识图谱的科学研究热点分析与预测方法,其特征在于该方法具体步骤包括:
步骤1.关键词提取与对齐;
步骤2.分析关键词共现网络,确定研究主题:
(2-1)词频计算:
结合词频g指数和实际数据的词频分布情况作为选取中高频词的依据,以1~5年的等长时间距离划分时间窗,统计每个时间窗中出现的中高频词的词频并计算词频变化情况,并按核心词,新兴词,突变词本身的特点进行识别;
(2-2)确定研究主题:
中高频关键词在同一个项目中的频率作为关键词之间的联系密切程度,利用ochiia系数计算关键词相关矩阵;以欧式距离衡量点间距离,聚类关键词形成词簇,确定研究主题;
A关键词与B关键词的ochiia系数:
(2-3)可视化研究主题结构:
计算衡量研究主题T与其他研究主题间关键词相互作用情况的向心度ST和研究主题T内关键词紧密程度的密度DT,并通过战略坐标图可视化所有研究主题的主题结构,战略坐标图以向心度ST为横坐标,以密度DT为纵坐标:
其中,O为ochiia系数,k和l为研究主题T的内部关键词,w为不属于研究主题T的关键词,Q为总词数,q为研究主题T内的关键词数量;
通过度量在不同时间窗下研究主题所处象限情况和研究主题内核心词、新兴词、突变词分布情况,确定热点研究主题、突变研究主题和新兴研究主题:在战略坐标图中,位于第一象限的研究主题为核心研究主题,其主题内部联系紧密,内部结构稳定;第二象限的研究主题为成熟研究主题,内部结构稳定,但与其他研究主题联系松散;第三象限的研究主题内部结构松散,研究不够成熟;第四象限的研究主题为活跃研究主题,但与其他研究主题联系比较紧密,是潜在的发展研究主题;通过向心度和密度了解所有研究主题的结构概况;热点研究主题由高频核心词聚集而成,是具有一定规模且内部结构稳定的词群;突变研究主题的词群包含大量突变词,在不同时间窗下变化非常显著;新兴研究主题以新兴词为主,词群内初始分布较为松散,但可能成长为热点研究主题;
步骤3.构建完整科学知识图谱:
对项目其他结构化数据进行数据融合,保证每个关键词对应到其所属学科,构建完整的科学知识图谱;所述的其他结构化数据包括项目所属学科、项目申请时间,构建科学知识图谱中涉及的知识加工手段包括知识推理、质量评估;
步骤4.解读知识图谱,探测研究主题演进趋势:
(4-1)挖掘研究主题间交叉关系和内部结构变化:
所有研究主题下的关键词频率将通过该研究主题涉及的总关键词频率进行归一化,利用KL散度计算研究主题之间的信息增益;KL值为0时,两大类型研究主题的关键词分布则完全相同;通过观察每个时间窗下三大类型研究主题中所有研究主题的KL值,得到任意两个研究主题在不同时间窗下的研究主题交叉情况和所有研究主题在演进过程中的内部结构变化幅度,挖掘出三大类型研究主题演进存在的规律和内部共性以预测未来的研究主题交叉情况;
(4-2)分析包含研究主题间因果关系的研究主题变化情况:
对存在显著Granger因果关系的研究主题对,对所有研究主题对应用霍克斯过程模型,通过建立某一研究主题历史行为与另一研究主题当前行为的关系计算研究主题之间的影响强度,构建研究主题影响网络;表示因果关系的影响显著性的P值小于0.05的,表示研究主题对存在显著Granger因果关系;
不同时间窗的研究主题影响网络通过对比和追踪核心词、突变词、新兴词的变化,识别热点研究主题、突变研究主题以及新兴研究主题的变化情况和趋势,通过社会网络分析法可视化三大类型研究主题演进的内部影响结构,对研究主题变化情况的分析和对未来趋势进行推断。
2.如权利要求1所述的一种基于知识图谱的科学研究热点分析与预测方法,其特征在于:步骤1中所述的关键词提取是根据已提供的关键词创建关键词表,对英文的题目、摘要进行分词和去停用词,以双向最大匹配算法匹配关键词表从而抽取关键词词串;双向最大匹配法算法使用正向最大匹配法和逆向最大匹配法进行切分,以大粒度词优先、非词表词最少为原则的分词结果选取关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910058235.9/1.html,转载请声明来源钻瓜专利网。