[发明专利]一种基于KDTree的图像数据库数据处理方法有效
申请号: | 202110139298.4 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112463804B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 王浩;秦拯;陈嘉欣;欧露 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/29;G06F21/57;G06F21/62;G06F40/289 |
代理公司: | 深圳市兴科达知识产权代理有限公司 44260 | 代理人: | 殷瑜 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kdtree 图像 数据库 数据处理 方法 | ||
1.一种基于KDTree的图像数据库数据处理方法,其特征在于,包括如下步骤:
步骤一、基于KDTree对地图标注信息进行遍历和整合,得到由n条标注构成的标注集S={s1,s2,…,sn};sn表示第n条标注;
具体包括如下步骤:
1.1提取地图的属性表中所有单字在地图上的位置坐标和字符内容形成数据集,根据每个字的二维坐标构建KDTree;
1.2将所有单字按纵坐标由大到小的顺序进行排列,得到初步的队列Q;创建一个标记数组vis[],用于记录队列Q中每个单字是否已处理,初始化为0,遍历队列Q直至队列Q为空;
1.3按照初步的队列Q中单字的排列顺序依次处理单字;
若当前单字点p未处理,即vis[p]=0,执行1.4步,并置vis[p]为1;
若当前单子点p已处理,即vis[p]=1,跳至队列Q中的下一个点;
1.4 在构建好的KDTree中查找距离当前单字点p范围为阈值[0, ε]的点,得到当前单字点p的近邻结点集,其中ε表示整合范围的参数,取前单字点p所对应字宽的1.5-2倍;在近邻结点集中按距离点p由近到远的顺序查找一个满足与当前单字点p整合条件的单字点q,若成功找到,则将当前单字点替换为q,并置vis[q]为1;单字点q即单字q在KDTree中对应的点;
1.5重复步骤1.4至近邻结点集中没有与当前单字点可以整合的单字点,则整合在一起的单字点作为一条标注;
1.6当近邻结点集中没有与当前单字点可以整合的单字点时;按照初步的队列Q中单字的排列顺序,处理下一个未处理的单字;
1.7重复步骤1.3-1.6至初步的队列Q中单字均完成处理;得到地图上的各条标注
步骤二、对标注集S进行基于词语相似度的敏感信息检测,将地图标注内容进行敏感度分级;
步骤三、根据地图标注内容的敏感度等级进行对应的脱敏处理。
2.如权利要求1所述的基于KDTree的图像数据库数据处理方法,其特征在于,步骤1.4中,所述整合条件如下:
单字点q未处理过,即vis[q]=0;
情况一、当已整合字段中只包含一个当前单字点p,则当前单字点p与近邻结点集中与前单字点p距离最近的单字点q进行整合;当近邻结点集中只有单字点p,则单字点p自身构成一个标注;
情况二、当已整合字段中包含两个及以上字时,即由多个字构成的字段与单字点q进行整合时,判断单字点q与已整合字段构成的新字段s中所有的字是否处于同一直线且由每相邻两个字的距离构成的数组的极差R是否满足:
其中,Len表示构成的新字段s中所包含的单字个数,表示新字段s中第
上述2个整合条件,若均满足则多个字构成的字段与单字点q进行整合,若至少有一个不满足,则多个字构成的字段不与单字点q进行整合。
3.如权利要求2所述的基于KDTree的图像数据库数据处理方法,其特征在于,在整合前,首先排除重复字的干扰,若p、q对应的字框相交、且字的内容相同,则p、q是重复字,在属性表中删除q实现去重。
4.如权利要求1所述的基于KDTree的图像数据库数据处理方法,其特征在于,步骤1.7中针对水平分布的标注,将标注中的单字按照横坐标自小到大的顺序,从左到右按照顺序排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110139298.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序