[发明专利]基于大数据分析的采集噪声点挖掘方法及大数据采集系统在审
申请号: | 202210381584.6 | 申请日: | 2022-04-13 |
公开(公告)号: | CN114691665A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 徐信福;苏健明 | 申请(专利权)人: | 辽源市讯展网络科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 136300 吉林省*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 分析 采集 噪声 挖掘 方法 系统 | ||
本申请实施例提供一种基于大数据分析的采集噪声点挖掘方法及大数据采集系统,通过挖掘多个训练冗余反馈数据节点中的各训练冗余反馈数据节点的冗余采集字段以及训练源数据采集轨迹所覆盖的样本采集路由空间,而后逐一挖掘样本采集路由空间中的各样本采集路由节点的样本采集路由字段,然后结合多个训练冗余反馈数据节点的冗余采集字段和样本采集路由空间的样本采集路由字段,确定与训练源数据采集轨迹相关的采集噪声点以及与采集噪声点相关的多个连通采集噪声点,由此结合冗余采集反馈流程以及样本采集路由流程,追溯采集噪声点进行后续的大数据采集流程优化,由此提高大数据采集流程优化的可靠性。
技术领域
本申请涉及大数据采集技术领域,具体而言,涉及一种基于大数据分析的采集噪声点挖掘方法及大数据采集系统。
背景技术
随着人工智能技术的发展,基于人工智能模型进行训练样本数据的学习,以应用于相关的线上业务需求中。基于此,需要进行大量的训练样本数据的收集,这些训练样本数据的收集需要进行广泛的大数据,并且训练样本数据的可靠性也关乎到训练学习的可靠性。相关技术中,由于采集噪声点的存在,可能导致一些训练冗余反馈数据节点的产生。目前的噪声点挖掘方法中,主要是基于简单的预设字段规则进行筛选,难以有效且合理挖掘采集噪声点进行大数据采集流程优化,影响大数据采集流程优化的可靠性,由此影响最终的样本学习和训练效果。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于大数据分析的采集噪声点挖掘方法及大数据采集系统。
第一方面,本申请提供一种基于大数据分析的采集噪声点挖掘方法,应用于大数据采集系统,所述方法包括:
结合AI训练服务器下发的AI训练任务所请求的大数据采集流程的训练源数据采集轨迹从训练冗余反馈流程中确定多个训练冗余反馈数据节点,而后解析出所述多个训练冗余反馈数据节点中的各训练冗余反馈数据节点的冗余采集字段;
挖掘所述训练源数据采集轨迹所覆盖的样本采集路由空间,而后逐一挖掘所述样本采集路由空间中的各样本采集路由节点的样本采集路由字段;
结合所述多个训练冗余反馈数据节点的冗余采集字段和所述样本采集路由空间的样本采集路由字段,确定与所述训练源数据采集轨迹相关的采集噪声点以及与所述采集噪声点相关的多个连通采集噪声点,并结合所述采集噪声点以及与所述采集噪声点相关的多个连通采集噪声点对所述AI训练服务器进行大数据采集流程优化。
第二方面,本申请实施例还提供一种基于大数据分析的采集噪声点挖掘系统,所述基于大数据分析的采集噪声点挖掘系统包括大数据采集系统以及与所述大数据采集系统通信连接的多个AI训练服务器;
所述大数据采集系统,用于:
结合AI训练服务器下发的AI训练任务所请求的大数据采集流程的训练源数据采集轨迹从训练冗余反馈流程中确定多个训练冗余反馈数据节点,而后解析出所述多个训练冗余反馈数据节点中的各训练冗余反馈数据节点的冗余采集字段;
挖掘所述训练源数据采集轨迹所覆盖的样本采集路由空间,而后逐一挖掘所述样本采集路由空间中的各样本采集路由节点的样本采集路由字段;
结合所述多个训练冗余反馈数据节点的冗余采集字段和所述样本采集路由空间的样本采集路由字段,确定与所述训练源数据采集轨迹相关的采集噪声点以及与所述采集噪声点相关的多个连通采集噪声点,并结合所述采集噪声点以及与所述采集噪声点相关的多个连通采集噪声点对所述AI训练服务器进行大数据采集流程优化。
第三方面,本申请实施例还提供一种大数据采集系统,所述大数据采集系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现以上任意一方面所述的基于大数据分析的采集噪声点挖掘方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽源市讯展网络科技有限公司,未经辽源市讯展网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210381584.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置