[发明专利]一种基于语义概念空间的工业产业链的分布式索引方法有效
申请号: | 202110687741.1 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113505600B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 李攀硕;邓作林;鲁仁全;徐雍 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/36;G06F18/2135;G06F16/13;G06F16/182 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 张生梅 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 概念 空间 工业 产业链 分布式 索引 方法 | ||
本发明公开了一种基于语义概念空间的工业产业链的分布式索引方法,包括:建立基于工业大数据和网络特征分析的语义概念空间模型,语义概念空间是一个由数据集、关键词层语义链网络tSLN以及概念层语义链网络cSLN共同构成的一个开放系统;tSLN为关键词语义链网络,由所有关键词集合T与所有关键词之间的语义关系集合构成,cSLN为概念层语义链网络,由概念集合C与概念及其语义关系构成。对语义概念空间中进行预处理,然后对预处理之后的数据进行分布式构建并储存在各个分布式节点上;获取用户的检索要求,并分发到各个节点上,节点获得请求后,开始检索语义概念空间并返回检索结果,对节点返回的数据进行合并排序,返回给用户。
技术领域
本发明涉及语义概念空间与分布式索引技术领域,特别涉及一种基于语义概念空间的工业产业链的分布式索引方法。
背景技术
依据《新一代人工智能发展规划》,新一代人工智能技术将围绕大数据智能、群体智能、工业自主智能系统等方向持续攻关,并从基础理论、支撑体系、关键技术、创新应用等层面构筑知识群、技术群和产品群的生态环境。本发明针对工业产业链领域的语义概念空间的构建、语义分析、筛选与更新等,借助深度学习、人工智能、并行关联规则增量更新算法等技术,旨在构建概念引导的语义空间分布式索引方法。
工业产业链系统中存在大量需要语义识别的环节。传统的语义概念空间构建已有了一些应用,然而其大多面向单一的工业领域,针对来源广、数据量大且类型多样的工业大数据还存在一些不足。因此,针对工业数据来源广、数据量大且类型多样,造成的检索效率低、更新速度慢等问题。
现有技术的一些方法中,利用跨模态数据库,计算查询样例和查询目标的相似性,根据相似性得到目标模态数据的相关结果列表。然而,上述专利通过根据语义关系进行跨数据库进行相似性搜索,在数据量庞大的工业产业链领域,搜索准确率不高。
发明内容
本发明的目的是提供一种基于语义概念空间的工业产业链的分布式索引方法,通过对产业链的工业语义数据进行建模,建立语义分析,以对差异化工业大数据的快速多样访问需求。
为了实现上述任务,本发明采用以下技术方案:
一种基于语义概念空间的工业产业链的分布式索引方法,包括:
步骤1,建立基于工业大数据和网络特征分析的语义概念空间模型
语义概念空间是一个由数据集、关键词层语义链网络tSLN以及概念层语义链网络cSLN共同构成的一个开放系统;
首先通过对工业领域中从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造整个产品全生命周期各个环节所产生的各类数据,包括生产经营相关业务数据,设备物联数据,外部数据,进行归一化与标准化处理并构建数据集;然后针对数据集进行语义信息挖掘,文本分词,关键词提取和关联规则获取,得到关键词集合和概念集合;
关键词层语义链网络tSLN是由关键词及其语义关系集合RT构成的网络,表示为:
tSLN=T,RT=T,RT={titj,[wa,ws],1ti,tjT}
其中T为网络的顶点集合或称为关键词集合,每个顶点表示一个关键词;RT表示网络中边的集合,关键词之间可以同时存在多种语义关系,其中ti,tj为边的两个顶点,wa边表示两个顶点ti,tj之间的关联语义关系的权值,ws表示两个顶点ti,tj之间的相似语义关系的权值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110687741.1/2.html,转载请声明来源钻瓜专利网。