[发明专利]类人化图像识别方法和系统在审
申请号: | 202110958257.8 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113743481A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 杨海涛;刘爽;夏伟杰;陶咏志;李铮;孙海洋;冯霄鹏;向磊 | 申请(专利权)人: | 北京电信规划设计院有限公司;中讯邮电咨询设计院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 郑州异开专利事务所(普通合伙) 41114 | 代理人: | 韩华 |
地址: | 100048 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人化 图像 识别 方法 系统 | ||
本发明公开了一种类人化图像识别方法和系统,通过将真实场景的图像数据分类投入训练,得到独立的算法模块,提高算法的精确度,再结合人类的思维逻辑,引入逻辑判断,在算法模块外增加逻辑判断,自动选择合适的算法模型,提高算法模块的匹配性,从根本上解决真实应用场景中距离、光照、角度、形状等干扰因素对图像识别的影响,减少算法无法适应真实应用场景中距离、光照、角度、形状变化所引起的误报、错报、漏报和重报问题。
技术领域
本发明涉及图像识别领域,尤其是涉及类人化图像识别方法和系统。
背景技术
图像识别技术是信息时代的一门重要技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。近几年,随着计算机技术的发展,人类对图像识别技术的认识越来越深刻,已经研发出大量基于机器学习的机器视觉算法模型,如:R-CNN、Fast-RCNN、yolo、ssd、DSSD、FPN FRCN、RetinaNet。目前,使用基于机器学习的机器视觉算法模型的图像识别技术已经广泛应用在安全、生物、工业、农业、交通、医疗等领域,但其应用效果并不理想,难以对实际工作产生价值,用户体验差。这是因为真实的应用场景往往是复杂多变的,包含了各种可能性。如,待识别目标的距离、拍摄角度、拍摄时光线、形状以及背景环境的变化所呈现出来的图像特征可能是完全不同的,而基于机器学习的机器视觉算法模型无法应对多变的环境和目标,仅能对通用场景下图像特征稳定的图像进行准确识别,这就导致在实际应用中产生大量的误报、错报、漏报和重报,无法实现代替人类进行有效信息收集的目的。
当前常用的图像识别方法,通常先识别特定的目标,再识别该目标的细节,如先识别车辆,再进行车牌检测。该方案通过识别目标的从属关系避免一部分不合理的误报和错报,但并没有提高图像识别的准确率。因为,其没有从根本上解决真实应用场景中距离、光照、角度、形状等干扰因素对图像识别的影响。
发明内容
本发明目的在于提供一种类人化图像识别方法和系统,通过引入逻辑判断,自动选择合适的算法模型,从根本上解决真实应用场景中距离、光照、角度、形状等干扰因素对图像识别的影响。
为实现上述目的,本发明可采取下述技术方案:
本发明所述类人化图像识别方法,包括下述步骤:
S1,样本数据分类;所述样本数据是在具体真实应用场景中采集到的图像;所述分类包括第一分类和第二分类;按照待检测目标所关联的第一图像特征在具体真实应用场景中的出现情景,将所述第一分类分为若干个一级分类和若干个从属于一级分类的二级分类;按照具体真实应用场景中客观因素对待检测目标的影响,将所述第二分类分为若干个一级分类和若干个从属于一级分类的二级分类;
S2,制作训练数据集;所述训练数据集是同一分类下样本数据的集合体;其中第一分类的每个一级分类为一个训练数据集;第二分类的每个二级分类为一个训练数据集;
S3,训练数据集数据增强处理;通过对图像中局部或整体像素值进行数据增强,使原来特征不明显的区域变得相对突出,同时抑制不相关的区域特征,用于加强训练数据集中图像的特征;
S4,利用Yolo v5单目标检测算法,训练每个训练数据集,获得不同的检测模型;其中,第一分类的每个一级分类用于获得与待检测目标相关的第一图像特征检测模型;第二分类的每个二级分类用于获得针对不同检测目标的检测模型;
S5,将第一分类和第二分类的一级分类进行组合,形成多个检测通道;每个所述检测通道均包含通用图像检测模型和从第一分类一级分类训练数据集中获得的所有检测模型以及从第二分类一级分类包含的所有二级分类训练数据集中获得的所有检测模型;
S6,根据图像采集设备的采集情景,为每个图像采集设备配置相应的检测通道;
S7,获得待检测图像和待检测目标,进入采集待检测图像的图像采集设备配置的检测通道;
S8,根据判断规则判断与待检测目标相关的第一图像特征;如果该步没有判断出与待检测目标相关的第一图像特征,则直接执行S11步;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京电信规划设计院有限公司;中讯邮电咨询设计院有限公司,未经北京电信规划设计院有限公司;中讯邮电咨询设计院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110958257.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序