[发明专利]一种基于知识图谱的科学研究热点分析与预测方法有效
申请号: | 201910058235.9 | 申请日: | 2019-01-22 |
公开(公告)号: | CN109800288B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 张子柯;李丽霞;任卓明 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于知识图谱的科学研究热点分析与预测方法。本发明方法通过关键词的共词关系确定研究主题,并根据高频的核心词,中、高频的突变词和新生词分布情况划分热点研究主题、突变研究主题、新兴研究主题和一般研究主题,最后从主题间的内在交叉关系和主题的变化情况两个角度出发,解读知识图谱的研究主题结构和趋势以预测其中三大研究主题的未来发展。本发明方法首先进行关键词提取与对齐,然后分析关键词共现网络,确定研究主题,构建完整科学知识图谱,最后解读知识图谱,探测主题演进趋势。本发明方法对主题趋势的挖掘更有针对性,分析结果更加客观准确。 | ||
搜索关键词: | 一种 基于 知识 图谱 科学研究 热点 分析 预测 方法 | ||
【主权项】:
1.一种基于知识图谱的科学研究热点分析与预测方法,其特征在于该方法具体步骤包括:步骤1.关键词提取与对齐;步骤2.分析关键词共现网络,确定研究主题:(2‑1)词频计算:结合词频g指数和实际数据的词频分布情况作为选取中高频词的依据,以1~5年的等长时间距离划分时间窗,统计每个时间窗中出现的中高频词词频次数并计算词频变化情况,并按核心词,新兴词,突变词本身的特点进行识别;(2‑2)确定研究主题:中高频关键词在同一个项目中的频率作为关键词之间的联系密切程度,利用ochiia系数计算关键词相关矩阵;以欧式距离衡量点间距离,聚类关键词形成词簇,确定研究主题;A关键词与B关键词的ochiia系数:
(2‑3)可视化主题结构:计算衡量主题T与其他主题间关键词相互作用情况的向心度ST和主题T内关键词紧密程度的密度DT,并通过战略坐标图可视化所有研究主题的主题结构,战略坐标图以向心度ST为横坐标,以密度DT为纵坐标:
其中,O为ochiia系数,k和l为主题T的内部关键词,w为不属于主题T的关键词,Q为总词数,q为主题T内的关键词数量;通过度量在不同时间窗下主题所处象限情况和主题内核心词、新兴词、突变词分布情况,确定热点研究主题、突变研究主题和新兴研究主题:在战略坐标图中,位于第一象限的主题为核心研究主题,其主题内部联系紧密,内部结构稳定;第二象限的主题为成熟研究主题,内部结构稳定,但与其他主题联系松散;第三象限的主题内部结构松散,研究不够成熟;第四象限的主题为活跃主题,但与其他主题联系比较紧密,是潜在的发展主题;通过向心度和密度了解所有研究主题的结构概况;步骤3.构建完整科学知识图谱:对项目所属学科、项目申请时间等其他结构化数据进行数据融合,保证每个关键词对应到其所属学科,构建完整的科学知识图谱,涉及的知识加工手段包括知识推理、质量评估;步骤4.解读知识图谱,探测主题演进趋势:(4‑1)挖掘主题间交叉关系和内部结构变化:所有主题下的关键词频率将通过该主题涉及的总关键词频率进行归一化,利用KL散度计算主题之间的信息增益;KL值为0时,两大研究主题的关键词分布则完全相同;通过观察每个时间窗下三大研究主题类型中所有主题的KL值,得到任意两个主题在不同时间窗下的主题交叉情况和所有主题在演进过程中的内部结构变化幅度,挖掘出三大类型的研究主题演进存在的规律和内部共性以预测未来的主题交叉情况;(4‑2)分析包含主题间因果关系的主题变化情况:对存在显著Granger因果关系的主题对,对所有主题对应用霍克斯过程模型,通过建立某一主题历史行为与另一主题当前行为的关系计算主题之间的影响强度,构建主题影响网络;表示因果关系的影响显著性的P值小于0.05的,表示主题对存在显著Granger因果关系;不同时间窗的主题影响网络通过对比和追踪核心词、突变词、新生词的变化,识别核心主题、突变主题以及新兴主题的变化情况和趋势,通过社会网络分析法可视化三大类型演进的内部影响结构,对研究主题变化情况的分析和对未来趋势进行推断。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910058235.9/,转载请声明来源钻瓜专利网。