[发明专利]科技情报分析中结合时滞计算的学科主题演化推理方法有效
申请号: | 201911081064.8 | 申请日: | 2019-11-07 |
公开(公告)号: | CN111046167B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 陆伟;杨金庆;魏雨晗;吴乐艳 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/383;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 科技情报 分析 结合 计算 学科 主题 演化 推理 方法 | ||
1.一种科技情报分析中结合时滞计算的学科主题演化推理方法,其特征在于,包括以下步骤:
步骤1:输入来源多样的学科数据文档;
步骤2:将上述文档以年为单位分别抽取主题;
步骤3:以年为单位计算上述从来源多样的学科数据文档中抽取的主题间相似度;
步骤4:通过中位数确定阈值,生成相似矩阵,寻求相似矩阵二分图最优匹配组合,构建线性方程模型并拟合计算时滞程度;
步骤5:根据步骤4计算的时滞程度,并结合步骤3计算的相似度进行多源数据学科主题融合;
其中,从学科主题知识单元层面,根据学科主题知识关联强度设定关联强度阈值,以此对不同数据源的学科主题进行融合;
融合立足于时滞计算结果,选择学科主题融合时间点,将学科主题知识关联强度超过阈值的视为同一主题消除重复,统一表示;融入时滞计算的多源科技文献融合策略包括两种方式:其一,从学科主题知识单元层面,根据学科主题知识关联强度设定关联强度阈值,以此对不同数据源的学科主题进行融合;其二,以时滞程度为归类标准,直接汇聚不同年份多源科技文献数据集,然后识别学科主题;
步骤6:从时间维度,将融合多源数据的学科主题进行演化推理,获得演化趋势。
2.根据权利要求1所述的科技情报分析中结合时滞计算的学科主题演化推理方法,其特征在于:步骤1中,所述来源多样的学科数据文档包括学术论文、基金文档、专利文本、会议资料。
3.根据权利要求1所述的科技情报分析中结合时滞计算的学科主题演化推理方法,其特征在于:步骤2中,利用LDA主题模型主题抽取方法将上述多源数据文档进行主题的抽取。
4.根据权利要求1所述的科技情报分析中结合时滞计算的学科主题演化推理方法,其特征在于:步骤3中,从主题共词强度角度,构建学科主题相似度MJC(q,r)计算方法,MJC(q,r)为:
MJC(q,r)=∑1/(-lgαq·βr)Where wq=wr
式中,αq表示主题q中主题词wq的概率权重,βr表示主题r中主题词wr的概率权重;
以主题模型抽取主题的主题词概率为权重,计算学科主题共词强度,计算步骤2中抽取的主题相似度。
5.根据权利要求1所述的科技情报分析中结合时滞计算的学科主题演化推理方法,其特征在于:步骤4中,利用匈牙利最优匹配算法寻求相似度损耗最小条件下的最优组合,采取回归分析的思想,通过计算点到直线距离最小,拟合线性方程y=x+b,计算不同科技文献间的时滞程度;其中,如果x表示一种科技文献的年份,y表示另一种科技文献的年份,普遍存在连续多年y-x=b,那么b表示两种科技文献之间存在的时滞程度;同时考虑到年份值为整数,且各年份相似矩阵为方形对称矩阵,结合理论分析确定线性方程模型为:y=x+b,且b为整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911081064.8/1.html,转载请声明来源钻瓜专利网。