[发明专利]基于SMT质量大数据分析的知识图谱构建方法在审
申请号: | 202210870267.0 | 申请日: | 2022-07-18 |
公开(公告)号: | CN115098703A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 常建涛;原韻松;孔宪光;陈维波;李鑫 | 申请(专利权)人: | 西安电子科技大学;中国电子科技集团公司第十研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F40/295;G06N3/04;G06N3/08;G06N5/00;G06N20/20;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 smt 质量 数据 分析 知识 图谱 构建 方法 | ||
本发明公开一种基于SMT质量大数据分析的知识图谱构建方法,其步骤为:对SMT产线文本数据集进行预处理,生成SMT产线文本数据训练集和测试集,构建并训练BERT‑Bi‑LSTM‑CRF命名实体模型,其结构包括BERT嵌入层,Bi‑LSTM层和CRF层;构建并训练BERT实体关系抽取模型,其结构包括BERT编码层、信息交互层和关系抽取层;对SMT产线结构化数据进行预处理;利用XGBoost算法计算结构化数据的影响因素;通过SMT产线高发缺陷成因关联分析构建SMT产线质量知识图谱。本发明提高了SMT企业累计数据利用率,形成规则,降低产品坏品率,降低企业生产成本。
技术领域
本发明属于物理技术领域,更进一步涉及数据处理技术领域中的一种基于表面贴装技术SMT(Surface Mounted Technology)质量大数据分析的知识图谱构建方法。本发明可基于多源多模态数据构建SMT行业的知识图谱。
背景技术
电子制造企业在生产中积累了大量的生产经验知识,但多以孤立的技术文档等非结构化文本形式存在,尚未形成统一的知识库,不利于知识的复用、传承和管理。企业借助于信息化系统在生产中积累的海量结构化数据,但这些数据并未被充分利用,其中潜在的价值多被忽略。充分发掘各类数据的价值,实现各类数据中知识的高效利用和统一管理对SMT产线工艺改善和产品质量提升具有重要意义。利用实体识别,关系抽取处理技术可以获取文本的特定信息;借助数据挖掘技术可以实现结构化数据中隐含关键信息的发现,知识图谱技术可以实现大规模知识的统一表示和高效索引。
南京中禹智慧水力研究院有限公司在其申请的专利文献“一种水务领域知识图谱的构建方法”(申请号202111011676.7申请公布号CN 113918725 A)中公开了一种河湖健康知识图谱的构建方法。该方法的实现步骤是:第一步,对数据进行校验和去噪音。第二步,基于Neo4j平台构建水务领域知识图谱顶层概念模型,作为水务领域知识图谱骨架。第三步,从行业标准、各类数据库、政府职能部门网站、水文水环境检测网站、公众网站、物联网数据和遥感影像等结构化数据、半结构化数据及非结构化数据中,采用数据库、爬虫、卷积神经网络技术进行实体抽取和关系抽取。第四步,将具有相同指代的实体三元组数据挂接同一个概念下,通过计算概念实体之间的相似度,完成实体对齐。第五步,基于Neo4j平台的图数据库完成知识的存储。该方法存在的不足之处是,由于卷积神经网络的结构中存在池化层,当抽取非结构化数据实体时,导致丢失有价值的信息,降低模型抽取水务实体的准确率。
上海精密计量测试研究所在其申请的专利文献“装备试验数据知识图谱构建方法”(申请号202111512535.3申请公布号CN 114417005 A)中公开了一种装备试验数据知识图谱构建方法。该方法的实现步骤是:第一步,集成已有的装备试验数据。第二步,对试验数据进行数据清洗及结构化处理。第三步,构建试验数据的元模型。第四步,对试验数据进行内容识别,特征提取,再按照元模型进行存储。第五步,基于试验数据构建数据实体,建立实体之间的连接。第六步,基于知识图谱构建工具,导入所有的实体以及实体之间的关系,形成装备试验数据知识图谱。该方法存在的不足之处是,没有针对非结构化数据建立知识抽取模型,难以应用于拥有大量非结构数据的SMT领域。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于SMT质量大数据分析的知识图谱构建方法,用于解决抽取非结构化数据实体时抽取准确率低,以及缺乏非结构化数据建立知识抽取模型,难以应用于拥有大量非结构数据的SMT领域的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学;中国电子科技集团公司第十研究所,未经西安电子科技大学;中国电子科技集团公司第十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210870267.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置