[发明专利]文献资源主题聚类共现潜在语义向量空间模型语义核方法有效
申请号: | 201611095873.0 | 申请日: | 2016-12-02 |
公开(公告)号: | CN106708969B | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 牛奉高;张亚宇 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 14105 山西五维专利事务所(有限公司) | 代理人: | 郭海燕 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于语义向量空间模型语义核方法技术领域,具体涉及一种文献资源主题聚类共现潜在语义向量空间模型语义核方法。本发明主要解决目前的语义向量空间模型语义核方法存在语义信息提取复杂度较大、语义信息提取不充分、模型的维度较高、且应用于聚类算法时时间和空间上的复杂度较高等问题。本发明文献资源主题聚类共现潜在语义向量空间模型语义核方法,包括以下步骤:第一步文献数据的预处理;第二步所提取的关键词进行词频统计,以备后续建立共现矩阵使用;第三步以关键词在文献中是否出现为权重,构建文献表示的向量空间模型;第四步共现潜在语义向量空间模型的构建;第五步语义核函数的构建;第六步文献聚类。 | ||
搜索关键词: | 语义 向量空间模型 潜在语义 构建 聚类 语义向量空间 语义信息提取 文献资源 复杂度 预处理 词频统计 矩阵使用 聚类算法 文献数据 核函数 权重 维度 应用 | ||
【主权项】:
1.文献资源主题聚类共现潜在语义向量空间模型语义核方法,其特征在于包括以下步骤:/n第一步:文献数据的预处理:数据清洗,标记文献,提取每篇文献的关键词,并保留关键词与相应文献的对应关系;/n第二步:所提取的关键词进行词频统计,关键词按词频降序排列,以备后续建立共现矩阵使用;/n第三步:以关键词在文献中是否出现为权重,构建文献表示的向量空间模型如下:/nd
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611095873.0/,转载请声明来源钻瓜专利网。
- 上一篇:软件异常检测方法及装置
- 下一篇:一种煤矿高压电网短路电流并行计算方法