[发明专利]一种BIM和GIS的语义匹配方法及装置在审
申请号: | 201911274882.X | 申请日: | 2019-12-12 |
公开(公告)号: | CN111178083A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 丁小辉;李勇;杨骥;黄吴蒙;李华朋 | 申请(专利权)人: | 广州地理研究所;南方海洋科学与工程广东省实验室(广州) |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F30/13;G06F16/29 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 潘桂生 |
地址: | 510075 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 bim gis 语义 匹配 方法 装置 | ||
1.一种BIM和GIS的语义匹配方法,其特征在于,包括以下步骤:
获取IFC和CityGML文件,提取所述IFC和CityGML文件中的实体名称和实体定义作为第一文本数据和第二文本数据;
将所述第一文本数据和第二文本数据中每一个字符串进行分割,获得若干字符;其中,每个字符串分别对应一个实体;
基于所述字符,利用哈希算法构建所述第一文本数据和所述第二文本数据中各字符串对应的词向量,得到第一词向量和第二词向量;
根据所述第一词向量与第二词向量,获取所述第一文本数据和第二文本数据中每两个实体之间的相似度;
根据相似度最高的两个词向量对应的文本数据,得到语义匹配结果。
2.根据权利要求1所述的BIM和GIS的语义匹配方法,其特征在于,所述提取对应的实体名称和实体定义作为第一文本数据和第二文本数据的步骤还包括:
在所述第一文本数据和第二文本数据中每一个字符串的前后设置开始符和结束符,将每一个字符串分隔开。
3.根据权利要求1所述的BIM和GIS的语义匹配方法,其特征在于,所述获取所述第一文本数据和第二文本数据中每两个实体之间的相似度步骤具体包括:
按照以下公式,计算第一文本数据和第二文本数据中每两个实体之间的相似度:
其中,Sim(i,j)表示实体i和j之间的语义相似度,vi和vj分别表示实体i和j的词向量,|vi|和|vj|分别为词向量vi和vj的模。
4.一种BIM和GIS的语义匹配装置,其特征在于,包括:
文本提取模块,用于获取IFC和CityGML文件,提取所述IFC和CityGML文件中的实体名称和实体定义作为第一文本数据和第二文本数据;
分割模块,用于将所述第一文本数据和第二文本数据中每一个字符串进行分割,获得若干字符;其中,每个字符串分别对应一个实体;
词向量构建模块,用于基于所述字符,利用哈希算法构建所述第一文本数据和所述第二文本数据中各字符串对应的词向量,得到第一词向量和第二词向量;
相似度计算模块,用于根据所述第一词向量与第二词向量,获取所述第一文本数据和第二文本数据中每两个实体之间的相似度;
语义匹配模块,用于根据相似度最高的两个词向量对应的文本数据,得到语义匹配结果。
5.根据权利要求4所述BIM和GIS的语义匹配装置,其特征在于,所述文本提取模块还包括:
分隔单元,用于在所述第一文本数据和第二文本数据中每一个字符串的前后设置开始符和结束符,将每一个字符串分隔开。
6.根据权利要求4所述BIM和GIS的语义匹配装置,其特征在于,所述相似度计算模块包括:
按照以下公式,计算第一文本数据和第二文本数据中每两个实体之间的相似度:
其中,Sim(i,j)表示实体i和j之间的语义相似度,vi和vj分别表示实体i和j的词向量,|vi|和|vj|分别为词向量vi和vj的模。
7.一种计算机可读存储介质,其上储存有计算机程序,其特征在于:该计算机程序被处理器执行时实现如权利要求1-3任意一项所述的BIM和GIS的语义匹配方法的步骤。
8.一种计算机设备,其特征在于:包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-3中任意一项所述的BIM和GIS的语义匹配方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州地理研究所;南方海洋科学与工程广东省实验室(广州),未经广州地理研究所;南方海洋科学与工程广东省实验室(广州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911274882.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏系统输出功率预测方法及装置
- 下一篇:一种隔离开关状态识别方法及装置