[发明专利]一种非相关文献隐性关联知识发现方法在审
申请号: | 201710453152.0 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107301218A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 曹志杰;沈剑;石宇萌 | 申请(专利权)人: | 北京航天长征科技信息研究所;中国运载火箭技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100076 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相关 文献 隐性 关联 知识 发现 方法 | ||
1.一种非相关文献隐形关联知识发现方法,其特征在于,包括以下步骤:
1)确定主题的初始检索词;
2)发现中间词、优化中间词以减少中间词数量并提高有意义中间词的排序、发现相应的中间文献集;
3)发现目标词、优化目标词以减少目标词数量并提高有意义目标词的排序、发现相应的目标文献集;
4)验证文献间的关联:
当发现文献关联时,则结束判定过程;
若未发现文献关联、且符合结束判定条件时,则结束判定过程;
若未发现文献关联、且不符合结束判定条件时,则将步骤2)中获得的中间文献集作为初始集,重复步骤2)-4)。
2.根据权利要求1所述的非相关文献隐形关联知识发现方法,其特征在于,所述步骤1)中采用自然语词抽取与处理或者索引词直接提取法确定主题的初始检索词。
3.根据权利要求1所述的非相关文献隐形关联知识发现方法,其特征在于,所述步骤2)中采用基于叙词表上位概念映射和/或基于战略坐标图的加权排序法对中间词进行优化。
4.根据权利要求1所述的非相关文献隐形关联知识发现方法,其特征在于,所述步骤2)中采用基于叙词表上位概念映射和/或基于战略坐标图的加权排序法对目标词进行优化。
5.根据权利要求3或4任一所述的非相关文献隐形关联知识发现方法,其特征在于,所述采用基于叙词表上位概念映射对中间词进行优化的方法,包括以下步骤:
1)按顺序选取中间词;
2)在叙词表中查找中间词的上位概念:
若为非最上位概念,继续查找,直至发现最上位概念;
若为最上位概念,则终止查找;
若叙词表中无此词,且中间词为可拆分词组,则将中间词进行拆分,继续查找,用拆分后词的最上位概念作为该中间词的最上位概念;
若叙词表中无此词,且中间词不可拆分,删除该中间词。
3)用查找到的最上位概念替代初始中间词;
4)上位概念统计排序;
5)建立新的中间词队列。
6.根据权利要求3或4任一所述的非相关文献隐形关联知识发现方法,其特征在于,所述采用基于战略坐标图的加权排序法对中间词进行优化的方法,包括以下步骤:
1)对中间词队列进行聚类分析,绘制战略坐标图;
2)为位于所述战略坐标图各个象限研究领域包含的关键词赋予权重;
3)按照权重重新排列中间词队列,同一权重按照词频高低排列;
4)设定权重阈值,对中间词进行过滤、排序形成新的中间词队列。
7.根据权利要求6所述的非相关文献隐形关联知识发现方法,其特征在于,所述步骤1)的具体方法为:
1)按照现有技术中的非相关文献隐形关联知识发现方法,发现中间词;
2)两两统计中间词在同一篇文献中出现的次数,形成共现矩阵;
3)对所述共现矩阵进行标准化处理:
4)将标准化后的矩阵值,输入聚类软件进行聚类,得到所述中间词的聚类结果;
5)根据聚类结果,将主题划分成若干研究领域;
6)绘制战略坐标图。
8.根据权利要求3所述的非相关文献隐形关联知识发现方法,其特征在于,同时采用基于叙词表上位概念映射和基于战略坐标图的加权排序法对中间词进行优化的方法为:
1)实施基于NASA叙词表上位概念映射的过滤改进,获取中间队列N1;
实施基于战略坐标图加权过滤改进,获取中间词集N2。
2)过滤中间词,形成新的中间词集Nn,计算方法为Nn=N1∩N2。
3)对Nn排序,获得中间词排序表。
9.根据权利要求3或4任一所述的非相关文献隐形关联知识发现方法,其特征在于,所述叙词表为NASA叙词表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长征科技信息研究所;中国运载火箭技术研究院,未经北京航天长征科技信息研究所;中国运载火箭技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710453152.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:改进的FP‑GROWTH方法
- 下一篇:一种电网规划数据管理系统