[发明专利]一种基于Flink框架的数据去重方法及装置有效

专利信息
申请号: 202011077804.3 申请日: 2020-10-10
公开(公告)号: CN112182289B 公开(公告)日: 2023-04-28
发明(设计)人: 吕泽 申请(专利权)人: 武汉中科通达高新技术股份有限公司
主分类号: G06F16/71 分类号: G06F16/71;G06F16/783;G08G1/017
代理公司: 深圳紫藤知识产权代理有限公司 44570 代理人: 张晓薇
地址: 430074 湖北省武汉市武汉东湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 flink 框架 数据 方法 装置
【权利要求书】:

1.一种基于Flink框架的数据去重方法,其特征在于,包括:

获取携带数据执行标识的数据执行请求;

根据所述数据执行标识,获取所述Flink框架中与所述数据执行标识对应的数据处理模型;

根据所述数据处理模型,判断所述数据执行请求携带的各视频数据中同一时间是否存在相同的车辆视频片段,并在各视频数据中同一时间存在相同的车辆视频片段时,对所述视频数据进行去重,得到所述去重视频数据;具体包括:按照时间顺序,处理各视频数据,得到各时间间隔中各视频数据中的车辆视频片段;根据各视频数据中的车辆视频片段,获取一视频数据中的车辆视频片段中的第一车辆信息;根据所述第一车辆信息,查找位于其他车辆视频片段中的第二车辆信息;根据所述第一车辆信息、所述第二车辆信息,判断所述第一车辆信息与所述第二车辆信息的相似度是否大于预设相似度;在所述第一车辆信息与所述第二车辆信息的相似度大于预设相似度时,判断所述第一车辆信息和第二车辆信息中是否存在车辆关键信息;在所述第一车辆信息和第二车辆信息中不存在车辆关键信息时,确定包含所述第一车辆信息的车辆视频片段与包含所述第二车辆信息的车辆视频片段为不同的车辆视频片段;在所述第一车辆信息和第二车辆信息中存在车辆关键信息时,确定包含所述第一车辆信息的车辆视频片段与包含所述第二车辆信息的车辆视频片段为相同的车辆视频片段;在同一时间间隔中各视频数据中存在相同的车辆视频片段时,删除相同的车辆视频片段中的重复车辆视频片段,得到去重视频数据。

2.如权利要求1所述的基于Flink框架的数据去重方法,其特征在于,所述在同一时间间隔中各视频数据中存在相同的车辆视频片段时,删除相同的车辆视频片段中的重复车辆视频片段,得到去重视频数据的步骤,包括:

获取相同的车辆视频片段中的各车辆视频片段的有效数据量;

根据各车辆视频片段的有效数据量,确定有效数据量最大的车辆视频片段;

保留有效数据量最大的车辆视频片段,并删除其他车辆视频片段,得到去重视频数据。

3.如权利要求1所述的基于Flink框架的数据去重方法,其特征在于,所述在同一时间间隔中各视频数据中存在相同的车辆视频片段时,删除相同的车辆视频片段中的重复车辆视频片段,得到去重视频数据的步骤,包括:

获取相同的车辆视频片段中的各车辆视频片段的清晰度;

根据各车辆视频片段的清晰度,确定清晰度最大的车辆视频片段;

保留清晰度最大的车辆视频片段,并删除其他车辆视频片段,得到去重视频数据。

4.如权利要求1所述的基于Flink框架的数据去重方法,其特征在于,所述根据所述数据处理模型,判断所述数据执行请求携带的各视频数据中同一时间是否存在相同的车辆视频片段,并在各视频数据中同一时间存在相同的车辆视频片段时,对所述视频数据进行去重,得到所述去重视频数据的步骤,包括:

获取所述去重视频数据、以及所述去重视频数据对应的重复视频数据;

根据所述去重视频数据、以及所述重复视频数据,赋予所述去重视频数据和所述重复视频数据相同的数据对应标识;

根据所述数据对应标识,将所述去重视频数据和所述重复视频数据存储在Hbase系统中。

5.如权利要求1所述的基于Flink框架的数据去重方法,其特征在于,所述根据所述数据执行标识,获取所述Flink框架中与所述数据执行标识对应的数据处理模型的步骤,包括:

根据所述数据执行标识,获取所述Flink框架与所述数据执行标识对应的Flink标识;

根据所述Flink标识,从所述Flink框架中获取所述数据处理模型。

6.如权利要求5所述的基于Flink框架的数据去重方法,其特征在于,所述根据所述Flink标识,从所述Flink框架中获取所述数据处理模型的步骤,包括:

设定初始数据处理模型;

获取测试视频数据、各测试视频数据对应的测试视频片段、以及各测试视频数据对应的测试去重视频片段;

采用初始数据处理模型处理各测试视频数据对应的测试视频片段,得到模型去重视频片段;

根据所述测试去重视频片段和模型去重视频片段,修正所述初始数据处理模型,得到数据处理模型。

7.一种基于Flink框架的数据去重装置,其特征在于,包括:

第一获取模块,用于获取携带数据执行标识的数据执行请求;

第二获取模块,用于根据所述数据执行标识,获取所述Flink框架中与所述数据执行标识对应的数据处理模型;

去重模块,用于根据所述数据处理模型,判断所述数据执行请求携带的各视频数据中同一时间是否存在相同的车辆视频片段,并在各视频数据中同一时间存在相同的车辆视频片段时,对所述视频数据进行去重,得到所述去重视频数据;具体用于:按照时间顺序,处理各视频数据,得到各时间间隔中各视频数据中的车辆视频片段;根据各视频数据中的车辆视频片段,获取一视频数据中的车辆视频片段中的第一车辆信息;根据所述第一车辆信息,查找位于其他车辆视频片段中的第二车辆信息;根据所述第一车辆信息、所述第二车辆信息,判断所述第一车辆信息与所述第二车辆信息的相似度是否大于预设相似度;在所述第一车辆信息与所述第二车辆信息的相似度大于预设相似度时,判断所述第一车辆信息和第二车辆信息中是否存在车辆关键信息;在所述第一车辆信息和第二车辆信息中不存在车辆关键信息时,确定包含所述第一车辆信息的车辆视频片段与包含所述第二车辆信息的车辆视频片段为不同的车辆视频片段;在所述第一车辆信息和第二车辆信息中存在车辆关键信息时,确定包含所述第一车辆信息的车辆视频片段与包含所述第二车辆信息的车辆视频片段为相同的车辆视频片段;在同一时间间隔中各视频数据中存在相同的车辆视频片段时,删除相同的车辆视频片段中的重复车辆视频片段,得到去重视频数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中科通达高新技术股份有限公司,未经武汉中科通达高新技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011077804.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top