[发明专利]数据处理方法与装置在审
申请号: | 201810018450.1 | 申请日: | 2018-01-09 |
公开(公告)号: | CN108564103A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 谢畅;钱浩然;徐宝函;陆王天宇 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 钟胜光 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标物体 类目标 样本 数据处理 图片 原型 图片样本 冷启动 融合 | ||
本发明公开了一种数据处理方法,包括:基于图片中的目标物体的类别,生成相应的目标物体原型,图片包括第一类目标物体和/或不同于第一类目标物体的第二类目标物体;基于图片中的目标物体的类别以及相应的目标物体原型,生成对应于图片中的目标物体的多个不同的样本;基于图片中的目标物体的类别,将多个背景和所生成的多个不同的样本分别融合,以确定与图片相对应的多个图片样本。通过本发明的技术方案,在冷启动时,可以自行生成样本以进行训练。
技术领域
本发明属于图像数据处理领域,尤其涉及一种基于机器学习的图像数据处理方法以及装置。
背景技术
机器学习是人工智能的一个分支。人工智能研究是从以“规则”为重点到以“推理”为重点再到“学习”为重点。因此,机器学习是现阶段实现人工智能的重要途径,即以机器学习为手段解决人工智能中的问题。机器学习主要是设计和分析一些让计算机可以自动“学习”的算法,从大量数据中自动分析获得规律,并利用规律对未知数据进行预测的方法。机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、证券市场分析等领域。
监督学习是机器学习的一种方式,它利用一组类别已知的样本调整学习模型的参数,使结果与已知类别拟合。这种学习方式需要标记大量训练样本。在监督学习中,每个实例都是有一个输入对象(特征)和一个期望输出值(监督信号)组成。监督学习算法分析训练数据,并产生一个推断功能,完成判别未知样本的标记,或者生成指定类别样本实例的任务。
深度学习是机器学习的一个分支,它试图使用包含复杂结构或由重非线性变换构成的多个处理层对数据进行高层抽象。基于数据观测值的各种表征,深度学习方法能高效地进行特征学习和分层特征提取,代替传统机器学习方法手工提取特征的方式,更容易完成从实例、抽象数据中完成学习任务。由于多层网络能够拟合复杂的非线性变换,在数据充足的情况下,深度学习的表现较传统学习方法在效果上有大幅提升。
数字图像处理是指对数字图像进行分析、加工和处理、使其满足视觉、心理或其他要求的技术。数字图像处理是信号处理在图像领域的一个应用。数字图像处理通常包括几何变换、颜色处理、图像融合、图像重建、边缘检测、图像分割、图像增强、压缩等。数字图像处理结合机器学习的方法,是目前解决计算机视觉领域相关问题的重要手段。
计算机视觉是通过图像处理、机器学习等方法,让计算机模拟生物视觉感知机制或根据输入信号,做出与生物视觉系统等效的响应,从而处理视觉感知相关问题,如目标跟踪、物体识别与分类、图像语义分析、图像重建等。随着机器学习相关算法模型的不断发展,目前计算机视觉领域的问题通过深度学习方法,较传统的自底向上的图像处理方法,在算法效果有大幅提升。
由于视觉相关数据,如图像、视频等天然带有语义信息,容易对这些数据或者数据中的局部信息打上标签,因此对于常见的计算机视觉问题如人脸识别、目标检测、物体分类等,都是采用监督学习的方式。这种需要标注数据的学习方式既有利也有弊。一方面,标注数据使得学习任务明确,目标清晰,容易得到期望结果;另一方面,相关的算法模型需要大量标注数据支撑,如果没有标记数据,或者数据达不到一定数量,则会造成算法难以启动,或最终结果与期望值相差明显的情况。
因此,亟需提供一种能够实现快速冷启动的方法。
发明内容
本发明针对机器学习处理任务中,针对缺乏训练样本造成难以启动的问题,提出了一种自行生成多个样本的数据处理方法。
本发明的一方面提出了一种数据处理方法,包括:基于图片中的目标物体的类别,生成相应的目标物体原型,所述图片包括第一类目标物体和/或不同于所述第一类目标物体的第二类目标物体;基于所述图片中的目标物体的类别以及相应的目标物体原型,生成对应于所述图片中的目标物体的多个不同的样本;基于所述图片中的目标物体的类别,将多个背景和所生成的多个不同的样本分别融合,以确定与所述图片相对应的多个图片样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810018450.1/2.html,转载请声明来源钻瓜专利网。