[发明专利]一种基于深度学习的地理信息的自动标注方法及装置有效

申请号：	201811434810.2	申请日：	2018-11-28
公开（公告）号：	CN109614455B	公开（公告）日：	2020-12-01
发明（设计）人：	凌广明;徐武平;穆晓峰;徐爱萍	申请（专利权）人：	武汉大学
主分类号：	G06F16/29	分类号：	G06F16/29
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	罗飞
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习地理信息自动标注方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的地理信息的自动标注方法，其特征在于，包括：

步骤S1：获取原始数据集UserInfSet和专业数据集PlotSet；

步骤S2：对原始数据集UserInfSet和专业数据集PlotSet进行预处理；

步骤S3：将预处理后的专业数据集PlotSet与原始数据集UserInfSet进行匹配，从原始数据集UserInfSet中筛选出目标数据集；

步骤S4：基于预设规则对目标数据集进行排序；

步骤S5：为排序后的目标数据集设置标注参数；

步骤S6：基于设置的标注参数，合成语料库，将其作为标注结果；

其中，所述专业数据采用哈希表PlotsHashTable进行存储，步骤S3具体包括：

步骤S3.1：从原始数据集UserInfSet中读取一条原始数据UserInf；

步骤S3.2：将原始数据UserInf与哈希表PlotsHashTable中的专业数据进行匹配，获取原始数据UserInf中包含的小区个数PlotCount以及匹配信息MatchInf，其中，专业数据集PlotSet中的专业数据包含小区信息，匹配信息中包括匹配的起止位置；

步骤S3.3：如果PlotCount为0，则舍弃该原始数据，转至步骤S3.1，如果PlotCount为1，则转至步骤S3.4，如果PlotCount大于1，则根据起止位置获得空间位置关系，其中，空间位置是起止位置的形象化描述，再根据空间位置关系进行合并，并判断合并后的小区个数是否等于1，如果等于则转至步骤S3.4，否则转至步骤S3.1；

步骤S3.4：将筛选出的原始数据UserInf与匹配信息MatchInf记录于目标数据集中；

步骤S3.5：判断原始数据集UserInfSet中的数据是否读取完毕，如果读取完毕，则将步骤S3.4得到的结果作为目标数据集，否则，转至步骤S3.1，继续处理下一条数据；

在步骤S3.3中，根据空间位置关系进行合并，具体为：

采用几何空间中的临近原则进行合并，几何空间关系包括相容、相交、相邻、相离，在几何空间描述位于同一条线段上的两条子线段的位置关系，其中，将中间相差两个字但不包含特定字的情况作为相邻。

2.如权利要求1所述的方法，其特征在于，在步骤S4之后，所述方法还包括：

对排序后的目标数据集根据预设标识进行分割，得到N个Excel文件，其中，N为大于1的整数；

通过人工调整的方式，对N个Excel文件进行调整，获得优质的标注数据。

3.如权利要求2所述的方法，其特征在于，在通过人工调整的方式，对N个Excel文件进行调整，获得优质的标注数据之后，所述方法还包括：

对获得的优质的标注数据进行质量评估。

4.如权利要求1所述的方法，其特征在于，步骤S5体包括：

通过设置标注参数，获得预设标注标准BIO。

5.如权利要求1所述的方法，其特征在于，在步骤S6之后，所述方法还包括：