[发明专利]一种利用目标物定位和追踪装置对图像进行识别的方法有效
申请号: | 201610497936.9 | 申请日: | 2016-06-29 |
公开(公告)号: | CN106127203B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 孟祥雨 | 申请(专利权)人: | 孟祥雨 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种对目标物定位和追踪的装置其识别目标物图像的方法,涉及图像识别技术领域,它包括贴纸装置和带有摄像头的图像识别终端(3)和计算机(4),所述贴纸装置包括内圆贴纸(1)和外圆贴纸(2),所述图像识别终端(3)是智能手机,所述外圆贴纸(2)的内侧与内圆贴纸(1)的外侧相接,所述贴纸装置贴在目标物表面,所述图像识别终端(3)拍摄并识别带有贴纸装置的目标物,所述计算机(4)与图像识别终端(3)通信相连。本发明选用了结构优良的贴纸结构,并采用了阈值限定+轮廓检测的检测算法,该算法时间复杂度仅为O(n的平方),速度约是同类模式识别算法的100倍;该算法保证了在手机(或ARM板等)上运行的实时性以及准确性。 | ||
搜索关键词: | 一种 目标 定位 追踪 装置 图像 识别 方法 | ||
【主权项】:
1.一种利用目标物定位和追踪装置对图像进行识别的方法,其特征在于它包括以下步骤:装置,它包括贴纸装置和带有摄像头的图像识别终端(3)和计算机(4),所述贴纸装置包括内圆贴纸(1)和外圆贴纸(2),所述图像识别终端(3)是智能手机,所述外圆贴纸(2)的内侧与内圆贴纸(1)的外侧相接,所述贴纸装置贴在目标物表面,所述图像识别终端(3)拍摄并识别带有贴纸装置的目标物,所述计算机(4)与图像识别终端(3)通信相连;所述计算机(4)通过数据线或者无线网络与图像识别终端(3)通信相连;所述内圆贴纸(1)的半径是5mm,所述外圆贴纸(2)的半径是10mm;所述内圆贴纸(1)的颜色是红色,所述外圆贴纸(2)的颜色是绿色;①.将贴纸装置贴在目标物的表面;②.通过图像识别终端(3)拍摄多帧目标物的图像;③.图像识别终端(3)拍摄的图像数据传输给计算机(4);④.计算机(4)依次对图像数据进行处理;⑤.计算机(4)得到识别结果,并将识别结果传输给图像识别终端(3);所述步骤④中,计算机(4)对图像数据进行处理包括以下步骤:一、计算机(4)调用C++算法:首先在手机上通过摄像头获取到每一帧的拍摄图像,实时将图像数据地址传到C++端,进而转成opencv的C++图像结构:Mat结构;二、归一化图像大小:先缩小图像,保证运行速度,之后被缩小后的Mat结构分别被转化为了RGB空间和LAB空间;三、将缩小后的Mat结构转成RGB空间,即每个像素点颜色都是用不同强度的R,G和B三个矢量相加表示;四、分离RGB变量,得到分离后的数组,vbgr[0]即R分量,vbgr[1]即G分量,vbgr[2]即B分量;五、分量灰度限定,限定一:红色圆在RGB空间GB通道灰度限定,GB通道的差值的绝对值redMat相差不超过30;六、将缩小后的Mat结构转化为LAB空间,即每个像素点取坐标LAB,其中L表示亮度;A的正数代表红色,负数代表绿色;B的正数代表黄色,负数代表蓝色;七、分离LAB分量,得到分离后的数组,vlab[0]是L通道,vlab[1]是A通道,vlab[2]是B通道;八、取内圆,限定二:红色圆在LAB空间的A通道值大于150,小于230,并且在RGB空间的R通道值大于130;九、膨胀:内圆在运动过程中,会变扁成为椭圆,并且椭圆边缘会变模糊;十、取外圆,限定三:绿色圆在a通道值大于50小于115,并且在RGB空间的GB通道值相差大于70小于230;十一、闭操作:使用opencv的形态学函数morphologyEx,使得图像白色区域更连通,并减少黑色杂质;十二、结合选择:因为贴纸是外绿圆包内红圆,并且redMat1是实心/半实心的外绿圆,redMat2是红圆,所以有,限定四:只有当redMat1和redMat2相交的地方才是真正的红色圆区域;限定五:红圆R通道肯定比GB通道值大;结合限定一、限定四、限定五,即可得到初步的灰度图结果gray;十三、归一化大小:图像恢复原来大小,将灰度图gray放大到当前的四倍:此时gray就是红心圆的二值图像,图像中红心圆为白色,其他像素为黑色;十四、闭操作:进一步对识别结果gray图像做闭操作,消除二值图像中内部“空隙”,得到实心红圆二值图像;十五、寻找轮廓:使用opencv的findContours函数,从二值图像gray中找到0和1的交界,得到类型为vector<vector<Point>>的点数组,一组点数组找到一个轮廓;对得到的一组轮廓进行遍历,找出贴纸中红心圆对应的轮廓;把轮廓筛选结果存到minEllipse数组;十六、再次筛选;限定六:得到的轮廓大于2个或者为0个,认为没有对贴纸进行有效识别,赋值变量Tap=0:限定七:得到的轮廓为1个,认为对贴纸进行了有效识别,赋值变量Tap=1;此时,识别结果包括:中心x坐标值,中心y坐标值,椭圆长轴值A,椭圆短轴值B;十七、返回识别结果:将Tap值,中心x坐标值,中心y坐标值,椭圆长轴值A,椭圆短轴值B传输到智能手机操作系统中;十八、估算运动距离:通过前十七步可以得到每一帧图片中贴纸中心x坐标值,中心y坐标值,椭圆长轴值A和椭圆短轴值B;虽然椭圆长轴值A和椭圆短轴值B会随着贴纸与摄像头的距离不同而发生变化,但是由于贴纸中红圆的直径是10mm,因此我们总可以由红圆绝对直径与长轴或者短轴对应的像素点数的比值来估算单个像素点对应的绝对尺寸;下面估算任意相邻两个时间点t1和t2之间贴纸中心运动的绝对距离;对于时间t1点,得到红圆中心x坐标值xt1,中心y坐标值yt1,椭圆长轴或短轴值At1和椭圆长轴或短轴值Bt1;对于时间t2点,得到红圆中心x坐标值xt2,中心y坐标值yt2,椭圆长轴或短轴值At2和椭圆长轴或短轴值Bt2;在t2‑t1时间段内,单个像素点对应绝对尺寸为d=10/[At1+At2+Bt1+Bt2)/4];因此贴纸从t1时间点到t2时间点,x方向移动了(xt2‑xt1)*d,y方向移动了(yt2‑yt1)*d。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孟祥雨,未经孟祥雨许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610497936.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种西兰花育苗基质
- 下一篇:风力发电机定子用防电磁硅钢片