[发明专利]一种基于词袋模型的卡口无牌车辆车型识别方法有效

专利信息
申请号: 201510625981.3 申请日: 2015-09-28
公开(公告)号: CN105354533B 公开(公告)日: 2018-11-09
发明(设计)人: 陈莹;高含;化春键 申请(专利权)人: 江南大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06T7/13
代理公司: 哈尔滨市阳光惠远知识产权代理有限公司 23211 代理人: 张勇
地址: 214122 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 模型 卡口 车辆 车型 识别 方法
【权利要求书】:

1.一种基于词袋模型的卡口无牌车辆车型识别方法,其特征在于,包括以下步骤:

S01、读入一批卡口车辆图像,采用直方图分析法完成车辆定位后的图像,包括各个车型的车辆;

S02、提取车辆的前脸区域:采用Roberts算子对图像进行边缘检测,将边缘检测图像进行密度连接,对连接后的图像作相应分析得到车脸的水平边界,对水平分割后的图像再次进行密度连接,分割出车脸的垂直边界,最终得到车脸图像;

S03、对车脸图像进行分块,提取图像块的尺度不变局部特征算子特征;

S04、训练各类车辆车型,生成训练模板:训练图像为各个车型的车前脸图像,每个车型包括30张图像,利用K-means聚类成词袋模型字典,并构造空间信息,最后采用支持向量机对训练图像进行训练,得到训练模型;

S05、对测试图像进行车型分类:将每个图像块映射到词袋的字典中后,测试图像即表示为视觉词汇的直方图形式,同时构造词典模型的空间信息,采用支持向量机支持向量机对其进行分类;

所述步骤S02包括:

(1)采用Roberts算子对输入图像Im进行边缘检测得到边缘图Im_edge,计算Im_edge中像素个数edge_sum,当edge_sum>4000时,密度连接阈值设为Tr=40,当edge_sum<4000时,密度连接阈值Tr=30;

(2)对边缘图Im_edge作密度连接操作,采用10×30大小的滑动窗口进行计算,滑动单位为5,当窗口内像素数大于Tr时,将该窗口水平方向下半部分所对应的图像位置像素全部置为255,依次滑动窗口,最终得到密度连接后图像Im_conn;

(3)对密度连接图像Im_conn进行行方向求和,并计算得到和为非零的行位置conn_hz,根据conn_hz中相邻元素的差进行区分,当相邻2个值大于5时分为2部分,依次查看conn_hz中的值,从而将Im_conn中斑点按水平方向分为几个部分,针对这几个部分,分别根据位置、宽度、像素个数进行分析,排除不可能的区域,得到车脸的水平位置;

(4)对水平分割后的图像再次进行密度连接,分割出车脸的垂直边界,最终得到车脸图像;所述步骤S03包括:

将车脸图像I进行规则的网格分割,分成块p1、块p2、块pn,n为块数量,每个块为16×16像素,并对每个图像块进行稠密尺度不变局部特征算子特征描述,最终图像I将得到128×n维的特征向量{d1,d2..dj..dn},dj表示第j个块的特征向量,维数为128。

2.根据权利要求1所述的车型识别方法,所述步骤S04包括:

(1)将所有训练图像的稠密尺度不变局部特征算子特征采用K-means方法将距离较近的特征合为一类,最终将训练图像特征分成N类,从而生成词汇数是N的词袋模型词典,即聚类中心,V={w1,w2..wk..wN},其中wk表示第k个聚类中心词汇;

(2)把每幅训练图像表示成视觉单词的直方图形式,计算每个块到视觉词汇的最小欧式距离,将每幅图像的所有分块分别映射到词典中,所有训练图像即可表示成关于词袋模型视觉词典的直方图表示;

(3)将训练图像的特征送入支持向量机支持向量机进行训练,所采用的核函数为histogram intersection kernel,最终得到训练模型。

3.根据权利要求2所述的车型识别方法,所述步骤S05包括:

(1)计算块特征到词汇的最小欧式距离,从而将图像块映射到所属的视觉单词wk,k代表图像I的第j个块的特征向量分配到的wk的序号,该图像即可表示为视觉单词的直方图形式;

(2)找到相同标记的块,在图像坐标系中,以图像原点为中心,图像块的位置假设为该块的中心点,将相同标号的图像块按照到原点距离的大小进行升序排列;

(3)当排序完成以后,构造词袋模型全局空间信息:计算相邻两两图像块xi、xj与x轴正方向的夹角通过计算每个视觉单词wk的角度直方图信息h(wk),采用6个bin,即可完成全局空间信息的构造;

(4)构造词袋模型局部空间信息:将标记完成后将图像中所有块量化成关于自身标记的矩阵,此后开始对标记矩阵进行统计,设定3×3的滑动窗口,每次滑动单位为1,以滑动窗口内中心元素为参考,扫描与其相邻的8个元素的值是否相等,相等则将相应元素设为‘1’,否则为‘0’,最后统计各中心元素‘1’值的个数,即完成相同图像块的频率直方图统计过程;

(5)将计算得到的全局角度信息与局部频率信息进行归一化,并结合到一起组成7×N的空间信息,N表示词典大小,结合传统词袋模型模型,将具有空间信息的词袋模型送入支持向量机分类器进行分类,所采用的核函数为histogram intersection kernel。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510625981.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top