[发明专利]基于多源数据的热点技术预测方法有效

专利信息
申请号: 201710521012.2 申请日: 2017-06-29
公开(公告)号: CN109213869B 公开(公告)日: 2021-08-13
发明(设计)人: 刘淇;陈恩红;曾宪宇;武晗;朱洪渊 申请(专利权)人: 中国科学技术大学
主分类号: G06F16/36 分类号: G06F16/36;G06F40/289
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 任岩
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 热点 技术 预测 方法
【权利要求书】:

1.一种基于多源数据的热点技术预测方法,其中,包括:

获取多源数据;

根据所述多源数据筛选技术词汇和应用词汇;

针对每一所述技术词汇和应用词汇,按照时间统计其在所述多源数据中出现的比例得到一时序序列;

挖掘技术词汇和技术词汇之间以及技术词汇和应用词汇之间的依赖关系,根据所述依赖关系构建有向图;以及

根据所述时序序列和有向图预测热点技术。

2.根据权利要求1所述的热点技术预测方法,其中,根据序列匹配算法挖掘所述依赖关系,第一词汇的序列P和第二词汇的序列Q之间的互相关函数R(t)为:

其中,P=[p1,p2,p3,...,pm]和Q=[q1,q2,q3,...,qm],P(i)和Q(i)分别表示相应词汇在相应序列上第i个位置在数据资源中出现的比例值,i为任一整数,m为正整数,当1≤i≤m时,P(i)=pi,Q(i)=qi,当i<1或i>m时,相应的值P(i)和Q(i)均为0,R(t)表示将序列P平移t个时间单位后与序列Q的相关性,根据第一词汇的序列P和第二词汇的序列Q之间的互相关函数R(t)计算两序列之间的最佳匹配位置tp和最佳响应RPQ

tp=arg maxtR(t),RPQ=maxtR(t)。

3.根据权利要求2所述的热点技术预测方法,其中,挖掘技术词汇和技术词汇之间以及技术词汇和应用词汇之间的依赖关系,根据所述依赖关系构建有向图包括:

针对每一技术词汇,选取与其时序序列之间具有最大的M个最佳匹配位置和最佳响应的时序序列对应的词汇作为与该技术词汇有相似性和依赖性的技术词汇或者应用词汇;

根据该技术词汇与选取的技术词汇或者应用词汇之间的最佳匹配位置构建该技术词汇与选取的技术词汇或者应用词汇之间的箭头连线,若该技术词汇与选取的技术词汇或者应用词汇之间的最佳匹配位置为正,则箭头指向选取的技术词汇或者应用词汇,若该技术词汇与选取的技术词汇或者应用词汇之间的最佳匹配位置为负,则箭头指向该技术词汇,构建所述有向图。

4.根据权利要求3所述的热点技术预测方法,其中,根据所述时序序列和有向图预测热点技术包括:

利用IS HOT算法在筛选出的应用词汇中选择正在或者即将成为热点的应用,并记它们构成的集合为K={k1,k2,k3,......};以及

利用热点技术预判算法预测即将成为热点的技术。

5.根据权利要求4所述的热点技术预测方法,其中,所述IS HOT算法能根据任一技术词汇或应用词汇的时序序列,判断该技术是否正在或者即将被广泛研究或者该应用是否已经或者即将成为热点,所述IS HOT算法包括:

对于任一词汇的时序序列P=[p1,p2,p3,...,pm],设定判断阈值α和β,

若pm>α或者则输出结果为True,判定该词汇对应的技术正在或者即将被广泛研究,或者该词汇对应的应用已经或即将成为热点,否则输出结果为False。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710521012.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top