[发明专利]基于分布式系统的样本采集方法、装置、设备及介质有效
申请号: | 202010728386.3 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111597388B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 王水桃;黄哲 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06N3/04;G06N3/08;H04N5/91 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分布式 系统 样本 采集 方法 装置 设备 介质 | ||
本申请实施例公开了一种基于分布式系统的样本采集方法、装置、设备及介质,涉及数据采集技术领域。该方法包括:接收样本采集指令,设置定时采集任务;获取采集设备的设备信息并同步至本地存储的历史采集设备的设备信息中;触发定时采集任务;读取目标采集设备的设备信息,以获取设备标识符;识别出目标采集设备并建立通信连接,访问目标采集设备获取其视频流,从视频流中抓取若干份样本数据进行保存。本申请还涉及区块链技术,将样本数据存储至区块链网络。所述方法通过对真实场景中合理的时间段安排,和定时启动分布式任务抓拍场景样本数据,既实现了自动化的样本采集,减少了工作人员的操作量,又极大地提高了样本收集的速度及质量。
技术领域
本申请涉及数据采集技术领域,特别是一种基于分布式系统的样本采集方法、装置、设备及介质。
背景技术
人工智能有三要素,它们分别是数据、算力和算法。因为人工智能的根基是训练,只有通过大量的训练,神经网络才能总结出规律,应用到新的样本上。具体到目标识别领域,数据则是图片样本。对于需要深度学习的目标识别来说,网络越大,层数越多,需要的训练样本量也越多。
传统收集样本的方法主要有以下几种:1、从公开数据集中获取;2、从网络上的图片库中获取,例如百度图片;3、从数据提供方中购买。
对于上述方式中的第1、2种,其能收集到的真实场景样本数量有限,而且,仅靠人工收集的速度太慢。此外,这两种方式获取到的样本的质量并不高,无论是图片的分辨率还是大小,与现实场景中的监控图片都有较大差别。而对于第3种方式,目前市场上也没有相关的数据提供方可以提供符合一些特定真实场景的样本,如后厨视频智能识别系统所需的样本,用于满足后厨违规场景识别模型的训练。
发明内容
本申请实施例所要解决的技术问题是,提供一种基于分布式系统的样本采集方法、装置、设备及存储介质,减少人工工作量,提高真实场景下样本收集的速度及质量。
为了解决上述技术问题,本申请实施例提供一种基于分布式系统的样本采集方法,采用了如下所述的技术方案:
一种基于分布式系统的样本采集方法,包括:
接收样本采集指令,并响应于所述样本采集指令设置定时采集任务,所述样本采集指令中指定有目标采集时间;
获取采集设备的设备信息并同步至本地存储的历史采集设备的设备信息中,所述设备信息包括每个活跃的采集设备的设备标识符;
实时监控系统时间,在所述系统时间到达所述目标采集时间时,触发所述定时采集任务;
基于所述定时采集任务读取目标采集设备的设备信息,以获取所述设备信息中的设备标识符;
根据设备标识符识别出与之匹配的目标采集设备并建立通信连接,访问所述目标采集设备的接口地址获取其视频流,从所述视频流中抓取若干份样本数据进行保存。
为了解决上述技术问题,本申请实施例还提供一种基于分布式系统的样本采集装置,采用了如下所述的技术方案:
一种基于分布式系统的样本采集装置,包括:
任务设置模块,用于接收样本采集指令,并响应于所述样本采集指令设置定时采集任务,所述样本采集指令中指定有目标采集时间;
信息同步模块,用于获取采集设备的设备信息并同步至本地存储的历史采集设备的设备信息中,所述设备信息包括每个活跃的采集设备的设备标识符;
任务触发模块,用于实时监控系统时间,在所述系统时间到达所述目标采集时间时,触发所述定时采集任务;
信息读取模块,用于基于所述定时采集任务读取目标采集设备的设备信息,以获取所述设备信息中的设备标识符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010728386.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多音字读音预测方法、装置及计算机可读存储介质
- 下一篇:触控显示装置