[发明专利]一种知识地图生成方法及装置在审
申请号: | 201510771801.2 | 申请日: | 2015-11-12 |
公开(公告)号: | CN105447104A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 王全礼;邵小亮;谢隆飞;郑坚钢;陈飞;杨雷 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李金;王宝筠 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 地图 生成 方法 装置 | ||
技术领域
本发明属于知识地图技术领域,更具体的说,尤其涉及一种知识地图生成方法及装置。
背景技术
知识地图是知识库系统核心功能模块之一,其能够从多条知识组成的知识集合中抽取出来代表所述知识集合核心内容的词汇,并组装成网络结构将各条知识展示出来,因此通过知识地图可以迅速了解知识集合的核心内容以及多条知识之间的关系。
为了能够生成知识地图,其首要任务则是从知识集合中抽取到核心内容,并确定多条知识之间的关系,在申请号为201210383029.3的制作知识地图的方法中,该知识地图包含词汇(t)以及多个关联词汇,其技术方案为:建立词汇关联知识集{(t,si,wi)|i=1,…,n},其中si代表与该词汇配对的关联词汇,wi代表(t,si)的权重;提供使用者接口,以供查询该词汇;从该词汇关联知识集筛选出多个关联词汇共现配对;将该等关联词汇共现配对依K-means演算法分成多个群组;输出该知识地图,该知识地图以该词汇为中心,该等关联词汇以该等群组呈现。
从申请号为201210383029.3的制作知识地图的方法提供的技术方案可知:其在确定多条知识之间的关系是基于任意两个词汇组合的共现度来判断。但是计算任意两个词汇的共现度会造成大量的循环计算操作,使得计算复杂度提高,并且任意两个词汇可能包含有无意义词以及不符合语法要求的词汇,从而导致共现度计算不准确,导致得到的各条知识之间的关系不准确,进而使得知识地图的准确度降低。
发明内容
有鉴于此,本发明提供一种知识地图生成方法及装置,用于提高知识地图的准确度,并降低计算复杂度。技术方案如下:
本发明提供一种知识地图生成方法,所述方法包括:
获取同一类别中每条热门知识的关键词,其中所述类别是通过对知识列表进行聚类划分后得到,且所述知识列表中存储有所述热门知识;
计算每个所述关键词的关联关系,其中所述关联关系用于指示所述关键词与处于同一类别的关键词之间具有特定关系,以指示不同热门知识之间具有特定关系;
基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词;
基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系;
以所述中心节点为基准,依据所述知识地图中各个节点的层级关系生成所述知识地图。
优选地,所述计算每个所述关键词的关联关系,包括:
获取同一条热门知识的同一句话中的至少两个关键词;
如果所述同一条热门知识的同一句话中至少两个关键词相连,且在预设关键词集合中查找到相连的至少两个关键词,则所述相连的至少两个关键词具有强关联关系;
如果具有强关联关系的两个关键词中的第一关键词与其他具有强关联关系的两个关键词中的第二关键词相同,则具有强关联关系的两个关键词和其他具有强关联关系的两个关键词中的三个关键词具有推导关联关系;
如果所述同一条热门知识的同一句话中的至少两个关键词不相连,则不相连的至少两个关键词具有弱关联关系;
将每条热门知识的关键词按照预设词组长度进行分词,若分词后得到的关键词和分词前的关键词均在所述预设关键词集合中查找到,则分词后得到的关键词和分词前的关键词具有包含关联关系。
优选地,所述基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词,包括:
基于每个所述关键词的关联关系和预设关系权重,计算每个所述关键词的关联得分;
基于每个所述关键词的关联得分,从所有关键词中选取关联得分最高的关键词;
当所述关联得分最高的关键词的关联得分大于预设关联得分时,所述关联得分最高的关键词为所述知识地图的中心节点的关键词;
当所述关联得分最高的关键词的关联得分小于等于所述预设关联得分时,选取点击率最高的关键词为所述知识地图的中心节点的关键词。
优选地,基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系,包括:
当所述作为知识地图的中心节点的关键词的关联关系指示与相连的至少一个关键词具有强关联关系,则将所述作为知识地图的中心节点的关键词的强关联关系作为所述知识地图中至少一条知识路径中其他节点与所述中心节点的层级关系,其中所述知识路径的层级关系为所述作为知识地图的中心节点的关键词与相连的一个关键词之间的强关联关系,且每条所述知识路径基于的强关联关系不同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510771801.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络资源关联性确定方法和装置
- 下一篇:一种自动化数据挖掘预处理方法