[发明专利]装备标准的关联图谱构建方法在审
申请号: | 201810547824.9 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108804621A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 苏飏;何宽平;李立芳;李俊杰 | 申请(专利权)人: | 四川华控图形科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
地址: | 610056 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标准文档 关联关系 标准条目 装备标准 标准化 图谱构建 关联 构建 隐含 相似度确定 引用关系 组成单元 相似度 语料库 聚类 标注 图谱 | ||
1.装备标准的关联图谱构建方法,其特征在于,包括:
获取装备的模块划分数据,并根据所述模块划分数据提取装备的模块、部件和组件,构建装备内部各个组件的组成关联网;
获取装备的最小组成单元组件的标准化要素,并根据所述标注化要素获取与其对应的标准文档;
采用基于Open XML标准的标准文档自动提取方法提取每篇标准文档的标准条目及标准条目对应的内容;
提取标准文档中词汇中设定量的最高权重词汇作为标准文档的主题词;
通过标准文档中正文解析得到的标准文档引用关系和计算的两个标准文档之间的相似度得到标准文档之间的关联关系;
采用与两个标准文档相似度相同的计算方式计算所有标准文档中标准条目之间的相似度,并根据相似度确定标准条目之间的关联关系;
根据已知的标准条目与标准化要素之间的关联关系,获取未标注关联关系的标准条目与标准要素的关联关系,之后构建形成所有标准文档中标准条目与标准化要素之间的关联关系;
采用所有标准化要素、所有标准文档的主题词及标准文档中的领域词形成语料库,并根据语料库,采用k-means聚类方法或LDA聚类方法对所有的标准文档进行聚类,得到标准文档之间的隐含关系;
根据所有标准文档的隐含关系、标准文档与标准文档之间关联关系、标准条目之间的关联关系及标准条目与标准化要素之间的关联关系形成装备标准的关联图谱。
2.根据权利要求1所述的装备标准的关联图谱构建方法,其特征在于,所述提取标准文档中词汇中设定量的最高权重词汇作为标准文档的主题词进一步包括:
采用分词工具对标准文档进行分词操作,并对所有词汇进行词频统计,将得到的绝对词频作为词汇的初始权重;
根据词汇出现的位置及词汇所属领域的特性,对词汇进行加权处理,得到词汇的加权词频;
根据加权词频,采用TF-IDF算法计算词汇的TF-IDF值,并进行归一化处理得到词汇的最终权重,之后选取设定量的权重最高词汇作为标准文档的主题词。
3.根据权利要求1所述的装备标准的关联图谱构建方法,其特征在于,还包括提取标注文档中预设量权重最大的句子作为标准文档的摘要:
统计每个词汇在标准文档中出现的词频,并根据词频计算词汇的权重;
根据句子中所有词汇的词频、在标准文档中出现的位置及其所属领域特性,采用浅层句法分析方法计算句子的权重;
选取预设量的权重最大的句子作为摘要候选句子,之后将摘要候选句子按照在标准文档中出现的顺序输出构成摘要。
4.根据权利要求1所述的装备标准的关联图谱构建方法,其特征在于,两个标准文档之间的相似度的计算公式为:
其中,d(1)为标准文档1中的词袋向量;d(2)为标准文档2中的词袋向量;di(1)为词汇wi在标准文档1中的词袋向量;dj(2)为词汇wj在标准文档2中的词袋向量;Tij为标准文档d(1)中词汇wi被运送到标准文档d(2)的词汇wj时所需要的代价;costij为词汇wi和词汇wj对应的嵌入向量的欧式距离。
5.根据权利要求1或4所述的装备标准的关联图谱构建方法,其特征在于,所述标准文档之间引用关系的获取方法:
判断标准文档中是否存在其所引用的标准号及标准名称列表:
若存在列表,则定位所述列表在标准文档中出现的位置,并采用标准号提取方法提取引用标准号和标准名称,得到标准文档之间的引用关系;
若不存在列表,则提取标准文档中的标准号,并将标准号所在句子作为该标准文档与所引用标准关联的内容;
根据标准文档与所引用标准关联的内容,获取所引用标准号的标准条目;
根据所引用标准号的标准条目提取所引用标准号所在处内容,得到标准条目与标准条目之间的引用关系,并通过标准条目与标准条目之间的引用关系得到两个文档之间的引用关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川华控图形科技有限公司,未经四川华控图形科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810547824.9/1.html,转载请声明来源钻瓜专利网。