[发明专利]一种知识地图生成方法及装置在审
申请号: | 201510771801.2 | 申请日: | 2015-11-12 |
公开(公告)号: | CN105447104A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 王全礼;邵小亮;谢隆飞;郑坚钢;陈飞;杨雷 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李金;王宝筠 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 地图 生成 方法 装置 | ||
1.一种知识地图生成方法,其特征在于,所述方法包括:
获取同一类别中每条热门知识的关键词,其中所述类别是通过对知识列表进行聚类划分后得到,且所述知识列表中存储有所述热门知识;
计算每个所述关键词的关联关系,其中所述关联关系用于指示所述关键词与处于同一类别的关键词之间具有特定关系,以指示不同热门知识之间具有特定关系;
基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词;
基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系;
以所述中心节点为基准,依据所述知识地图中各个节点的层级关系生成所述知识地图。
2.根据权利要求1所述的方法,其特征在于,所述计算每个所述关键词的关联关系,包括:
获取同一条热门知识的同一句话中的至少两个关键词;
如果所述同一条热门知识的同一句话中至少两个关键词相连,且在预设关键词集合中查找到相连的至少两个关键词,则所述相连的至少两个关键词具有强关联关系;
如果具有强关联关系的两个关键词中的第一关键词与其他具有强关联关系的两个关键词中的第二关键词相同,则具有强关联关系的两个关键词和其他具有强关联关系的两个关键词中的三个关键词具有推导关联关系;
如果所述同一条热门知识的同一句话中的至少两个关键词不相连,则不相连的至少两个关键词具有弱关联关系;
将每条热门知识的关键词按照预设词组长度进行分词,若分词后得到的关键词和分词前的关键词均在所述预设关键词集合中查找到,则分词后得到的关键词和分词前的关键词具有包含关联关系。
3.根据权利要求2所述的方法,其特征在于,所述基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词,包括:
基于每个所述关键词的关联关系和预设关系权重,计算每个所述关键词的关联得分;
基于每个所述关键词的关联得分,从所有关键词中选取关联得分最高的关键词;
当所述关联得分最高的关键词的关联得分大于预设关联得分时,所述关联得分最高的关键词为所述知识地图的中心节点的关键词;
当所述关联得分最高的关键词的关联得分小于等于所述预设关联得分时,选取点击率最高的关键词为所述知识地图的中心节点的关键词。
4.根据权利要求3所述的方法,其特征在于,基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系,包括:
当所述作为知识地图的中心节点的关键词的关联关系指示与相连的至少一个关键词具有强关联关系,则将所述作为知识地图的中心节点的关键词的强关联关系作为所述知识地图中至少一条知识路径中其他节点与所述中心节点的层级关系,其中所述知识路径的层级关系为所述作为知识地图的中心节点的关键词与相连的一个关键词之间的强关联关系,且每条所述知识路径基于的强关联关系不同;
对于所述知识地图中其他知识路径,基于作为中心节点的关键词的关联关系与其他关键词的关联得分确定所述其他知识路径中其他节点与所述中心节点的层级关系,且所述其他知识路径的层级关系中不包括以所述知识地图的中心节点的关键词的强关联关系得到的层级关系。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述知识地图中第i级节点的关键词,i为大于等于1的整数,且i小于等于N,N为知识地图中层级数;
如果在关键词关联列表中查找到与所述第i级节点的关键词对应的第i+1级节点的关键词,则将所述第i+1级节点的关键词的关联知识列表合并到所述第i级节点的关键词的关联知识列表中,所述第i+1级节点为所述第i级节点的下一级节点;
去除所述第i+1级节点的关键词的关联知识列表和第i级节点的关键词的关联知识列表中的相同知识,得到第i级节点的关联知识列表;
如果在关键词关联列表中未查找到与所述第i级节点的关键词对应的第i+1级节点的关键词,则将所述第i级节点的关键词的关联知识列表按照点击量进行排序,排序后的关联知识列表为所述第i级节点的关联知识列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510771801.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网络资源关联性确定方法和装置
- 下一篇:一种自动化数据挖掘预处理方法