[发明专利]装备标准的关联图谱构建方法在审
申请号: | 201810547824.9 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108804621A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 苏飏;何宽平;李立芳;李俊杰 | 申请(专利权)人: | 四川华控图形科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
地址: | 610056 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标准文档 关联关系 标准条目 装备标准 标准化 图谱构建 关联 构建 隐含 相似度确定 引用关系 组成单元 相似度 语料库 聚类 标注 图谱 | ||
本发明公开了一种装备标准的关联图谱构建方法,其包括获取装备的标准化要素,并根据所述标注化要素获取与其对应的标准文档;提取每篇标准文档的标准条目及标准条目对应的内容;提取标准文档的主题词;通过标准文档引用关系和标准文档之间的相似度得到标准文档之间的关联关系;根据相似度确定标准条目之间的关联关系;构建所有标准文档中标准条目与标准化要素之间的关联关系;根据构建的语料库,对所有的标准文档进行聚类,得到标准文档之间的隐含关系;根据装备及其组成单元与标准化要素的关联关系,所有标准文档的隐含关系、标准文档之间关联关系、标准条目之间关联关系及标准条目与标准化要素之间的关联关系形成装备标准的关联图谱。
技术领域
本发明涉及关联图谱的构建方法,具体涉及一种装备标准关联图谱的构建方法。
背景技术
近年来随着公开的关联数据集等项目的开展,关于关联图谱的研究也逐渐深入。关联数据已成为国际互联协会(W3C)推荐的一种规范,用来发布和链接各类数据、信息和知识。到2010年底,基于互联网的关联数据集已经有100多种,覆盖了生物、地理、文化、智能制造等各个方面。
在装备标准领域,虽然目前已有大量标准化的研究被提出,但利用关联图谱技术进行装备标准化建设、管理的相关研究还是空白。装备标准关联图谱作为新兴的事物,国内外还没有现成的研究可供借鉴。
发明内容
针对现有技术中的上述不足,本发明提供的装备标准关联图谱的构建方法能够将装备的模块与相关的标准文档之间的关系联系起来。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种装备标准的关联图谱构建方法,其包括:
获取装备的模块划分数据,并根据模块划分数据提取装备的模块、部件和组件,构建装备内部各个组件的组成关联网;
获取装备的最小组成单元组件的标准化要素,并根据标注化要素获取与其对应的标准文档;
采用基于Open XML标准的标准文档自动提取方法提取每篇标准文档的标准条目及标准条目对应的内容;
提取标准文档中词汇中设定量的最高权重词汇作为标准文档的主题词;
通过标准文档中正文解析得到的标准文档引用关系和计算的两个标准文档之间的相似度得到标准文档之间的关联关系;
采用与两个标准文档相似度相同的计算方式计算所有标准文档中标准条目之间的相似度,并根据相似度确定标准条目之间的关联关系;
根据已知的标准条目与标准化要素之间的关联关系,获取未标注关联关系的标准条目与标准要素的关联关系,之后构建形成所有标准文档中标准条目与标准化要素之间的关联关系;
采用所有标准化要素、所有标准文档的主题词及标准文档中的领域词形成语料库,并根据语料库,采用k-means聚类方法或LDA聚类方法对所有的标准文档进行聚类,得到标准文档之间的隐含关系;
根据所有标准文档的隐含关系、标准文档与标准文档之间关联关系、标准条目之间的关联关系及标准条目与标准化要素之间的关联关系形成装备标准的关联图谱。
进一步地,提取标准文档中词汇中设定量的最高权重词汇作为标准文档的主题词进一步包括:
采用分词工具对标准文档进行分词操作,并对所有词汇进行词频统计,将得到的绝对词频作为词汇的初始权重;
根据词汇出现的位置及词汇所属领域的特性,对词汇进行加权处理,得到词汇的加权词频;
根据加权词频,采用TF-IDF算法计算词汇的TF-IDF值,并进行归一化处理得到词汇的最终权重,之后选取设定量的权重最高词汇作为标准文档的主题词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川华控图形科技有限公司,未经四川华控图形科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810547824.9/2.html,转载请声明来源钻瓜专利网。