[发明专利]一种非相关文献隐性关联知识发现方法在审

专利信息
申请号: 201710453152.0 申请日: 2017-06-15
公开(公告)号: CN107301218A 公开(公告)日: 2017-10-27
发明(设计)人: 曹志杰;沈剑;石宇萌 申请(专利权)人: 北京航天长征科技信息研究所;中国运载火箭技术研究院
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100076 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 相关 文献 隐性 关联 知识 发现 方法
【说明书】:

技术领域

发明属于知识发现技术领域,具体涉及一种非相关文献隐性关联知识发现方法。

背景技术

基于已有技术发现并开展前沿技术研发是企业发展的重要工作。但是在在国防领域,出于政治、军事等多种因素影响和保密等方面的要求,某些领域的科技文献往往不能公开发表,或者存在发表时间滞后、发表刊物偏离该领域核心期刊等现象。在进行前沿技术发展动向等方面的检索时,会出现应用传统方法难以发现有价值文献,无法为科研决策提供有效决策支持的情况。

现有技术中公开了知识发现相关的方法,如共引分析知识发现法、非相关文献知识发现法、文本挖掘知识发现法、知识网格知识发现法。这几类方法主要在理论探索与讨论、算法研究与改进、平台开发与应用、领域拓展及验证四个方向展开,对于文献间隐性关联知识发现的研究相对较少。文献“《非相关文献知识发现方法在航天科技情报研究中的应用分析》,曹志杰、冷伏海,情报理论与实践,2008,31(4):569-572”公开了非相关文献隐性关联知识发现的方法。该方法借助中间文献的概念,利用公开文献中的信息,进行有价值的关联发现,发现尚未被发现的客观隐性关联或复现被人为去除、隐藏或弱化的主观隐性关联,进而揭示出有意义的技术发展动向,为前沿技术研发,尤其是国防领域的特定前沿技术研发提高高质量的知识发现支撑。虽然该方法从一定程度上能够揭示非相关文献的隐形关联,但是在实际应用时,存在中间词或目标词过多、有意义的中间词或目标词在词频-字顺队列中排序相对靠后、发现过程需专家介入或需要较为专业的背景知识以提高发现效率、人工统计过于繁琐等问题,具有一定的应用局限性。

为此,需要一种改进的非相关文献隐性关联知识发现方法,以减少中间词或目标词数量、提升有意义中间词或目标词在词频-字顺队列中排序、以大幅提高非相关文献隐形知识发现的效率。

发明内容

本发明所要解决的技术问题是,研究提出一种优化的非相关文献隐性关联知识发现方法,能够大幅减少中间词或目标词数量、提升有意义中间词或目标词在词频-字顺队列中排序、有效提高非相关文献隐形知识发现的效率。

本发明公开了一种非相关文献隐性关联知识发现方法,包括以下步骤:

1)确定主题的初始检索词;

2)发现中间词、优化中间词以减少中间词数量并提高有意义中间词的排序、发现相应的中间文献集;

3)发现目标词、优化目标词以减少目标词数量并提高有意义目标词的排序、发现相应的目标文献集;

4)验证文献间的关联:

当发现文献关联时,则结束判定过程;

若未发现文献关联、且符合结束判定条件时,则结束判定过程;

若未发现文献关联、且不符合结束判定条件时,则将步骤2)中获得的中间文献集作为初始集,重复步骤2)-4);

优选地,所述步骤1)中采用自然语词抽取与处理或者索引词直接提取法确定主题的初始检索词。

优选地,所述步骤2)中采用基于叙词表上位概念映射和/或基于战略坐标图的加权排序法对中间词进行优化。

优选地,所述步骤2)中采用基于叙词表上位概念映射和/或基于战略坐标图的加权排序法对目标词进行优化。

优选地,所述采用基于叙词表上位概念映射对中间词进行优化的方法,包括以下步骤:

1)按顺序选取中间词;

2)在叙词表中查找中间词的上位概念:

若为非最上位概念,继续查找,直至发现最上位概念;

若为最上位概念,则终止查找;

若叙词表中无此词,且中间词为可拆分词组,则将中间词进行拆分,继续查找,用拆分后词的最上位概念作为该中间词的最上位概念;

若叙词表中无此词,且中间词不可拆分,删除该中间词。

3)用查找到的最上位概念替代初始中间词;

4)上位概念统计排序;

5)建立新的中间词队列。

优选地,所述采用基于战略坐标图的加权排序法对中间词进行优化的方法,包括以下步骤:

1)对中间词队列进行聚类分析,绘制战略坐标图;

2)为位于所述战略坐标图各个象限研究领域包含的关键词赋予权重;

3)按照权重重新排列中间词队列,同一权重按照词频高低排列;

4)设定权重阈值,对中间词进行过滤、排序形成新的中间词队列。

优选地,所述步骤1)的具体方法为:

1)按照现有技术中的非相关文献隐形关联知识发现方法,发现中间词;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长征科技信息研究所;中国运载火箭技术研究院,未经北京航天长征科技信息研究所;中国运载火箭技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710453152.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top