[发明专利]一种基于词袋模型和adaboosting的食堂自助计价方法有效
申请号: | 201910155376.2 | 申请日: | 2019-03-01 |
公开(公告)号: | CN110020668B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 盛庆华;郭晨洁;李竹;王韵涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 陆永强 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于词袋模型和adaboosting的食堂自助计价方法,步骤S1:图像采集装置9每隔1秒采集结算区图像;步骤S2:PC机8对采集到的图像进行预处理、提取特征点、构造视觉词典、adaboosting识别;步骤S3:结算终端装置11计算菜品总价并显示供用餐者支付。采用本发明的技术方案,通过建立词袋模型,利用SIFI算法从分块图像中提取关键特征,采用基于权值分层的k均值聚类构造最终的视觉词典,凭借其提取特征的强大可区分性,能够最大限度地与其他物体进行区分,即使物体处在非常复杂的条件之下,这些特征也能被较好地检测与识别出来。采用基于adaboosting的分类器对图像进行训练,得到预置的训练库,显著地提高了学习精度。 | ||
搜索关键词: | 一种 基于 模型 adaboosting 食堂 自助 计价 方法 | ||
【主权项】:
1.一种基于词袋模型和adaboosting的食堂自助计价方法,其特征在于,包括以下步骤:步骤S1:图像采集装置间隔采集当前结算区图像,并将采集到的结算区图像传送至PC机中;步骤S2:PC机对采集到的图像进行处理,其包括:预处理、提取特征点、构造视觉词典、adaboosting识别;步骤S3:结算终端装置计算菜品总价并显示供用餐者支付;其中,所述步骤S2进一步包括:步骤S21:将当前t时刻收到的输入图像与预先存储在PC机的结算区背景图像进行差分运算,判断当前是否有托盘进入结算区,将采集到的托盘图像分为n×n的像素fk(i,j),对每个像素都进行高斯分布建模,计算每个像素的L和σ,为每个像素都预设一个合理的差分阈值Th,当前图像的像素值与背景图像的像素值Bk(i,j)的差分值超过阈值时,即|fk(i,j)‑Bk(i,j)|>Th,判断有托盘进入结算区,且超过阈值的像素即是进入结算区的托盘;步骤S22:当检验出有托盘进入结算区后,用光流法判断托盘是否静止;假设流(dx,dy,dz)在一个大小为m×m×m(m<1)的小窗中是一个常数,那么像素1…n,n=m×m×m中可以得到关于像素值Ixn,Iyn,Izn变化的公式:方程组可进一步表示为:采用最小二乘法求出dx、dy及dz后,当dx、dy及dz为0时,可判断托盘处于静止状态;步骤S23:对当前时刻收到的输入图像与预存在PC机的空托盘图像做背景差分,并将差分图像转变成二值图像:Dk(x,y)=|fk(x,y)‑Pk(x,y)|其中,fk(i,j)是当前输入图像的像素值,Pk(i,j)是预存在PC机的空托盘图像的像素值,Dk(i,j)表示差分结果,Mk(i,j)表示二值化结果,Th1为设定的阈值;步骤S24:利用轮廓搜索算法,通过对二值图像中白色像素的标记,让每个单独的连通区域形成一个被标识的块,即把托盘上装有菜品的餐盘标记出来,再在原图像上进行标记,得到连通域分块模型;步骤S25:建立词袋模型,提取整合得到所有图像的视觉字典,进行adaboosting分类器的构建和训练,完成图像分类;步骤S251:利用SIFI算法从连通域分块图像中提取视觉词汇;将图像与高斯核函数进行卷积,得到高斯差分尺度空间;然后,利用极值点检测初步确定关键点所在的位置和尺度,粗糙地探测候选特征点的位置,对这些关键点进行精确的定位,得到其尺度、方向等信息,确定所需的候选特征点的精确位置信息;在候选特征点处对D(x,y,σ)进行泰勒展开如式下所示:其中X(x,y,σ)是对应采样点的偏移量;对上式求导并令其等于0,得出极值点的位置信息:联立上述两式,且只保留前两项:当小于设定阈值时,该点即被看做是低对比度点从而进行剔除;由此,每一个特征便具备了四个参数,中心点的水平坐标,中心点的垂直坐标、尺度以及方向;将尺度空间图像L(x,y,σ)记为L(x,y),则在特征点(x,y)处的梯度模值m(x,y)及方向θ(x,y)可计算为:最后,对特征进行描述,以关键点为圆心取16×16的邻域窗口,然后将该窗口分成4×4个子区域,在每个子区域中计算8个方向(0°,45°,90°,135°,180°,225°,270°,315°)的梯度累加值,每个特征便可以用4×4×8=128维的向量来表示;并给每一个特征点分配方向和尺度,以保证SIFI描述自具有图像旋转不变性;对特征向量进行归一化处理;设128维的特征向量为D=(d1,d2,…,d128),归一化处理后得到:步骤S252:将SIFI算法从分块图像中提取到的所有的视觉词汇集合在一起,采用基于权值分层的k‑means聚类构造视觉词典,对训练集中的N幅分块图像分别提取Laplace谱结构特征和SIFT局部特征并进行聚类,获得图像信息描述更完备的视觉词典CLK和CSK;首先对图像库中图像进行分层聚类,得到基于各个类别图像的视觉词典即子视觉词典CLKy和CSKy,其中,CLKy为第y类图像的Laplace谱结构特征聚类中心,CSky为第y类图像的SIFT局部特征聚类中心,ky为第y类训练图像聚类中心数,y=l,2,…M,M为图像类别数;其次对这些子视觉词典的集合再次进行聚类,得到父视觉词典CLK和CSK;最后对这两个父视觉词典进行权值分配处理,平衡两种图像特征在图像分类过程中所起的作用:其中,C为总视觉词典,为聚类的权值系数;步骤S253:采用adaboosting分类器进行训练,算法如下:(1)给定一系列训练样本(x1,y1),(x2,y2),…,(xn,yn),其中yi=0表示为负样本,yi=1表示其为正样本;n为一共的训练样本数量;(2)初始化权重wi=D(i);(3)对t=1,…,T:(4)归一化权对每一个特征f,训练一个弱分类器h(x,f,P,θ);计算对应所有特征的弱分类器的加权错误率εf:εf=∑iqi|hi,f,P,θ)‑yi|;然后选取最佳的弱分类器ht(x)(拥有最小错误率εt):再按照这个最佳弱分类器,调整权重:ei=0表示xi被正确分类,ei=1表示xi被错误分类;(5)最后的强分类器为:步骤S27:用经过训练的adaboosting分类器对测试集进行分类识别,得到菜品的种类及其数量,并将数据传送至所述结算终端装置;其中,步骤S3进一步包括:步骤S31:结算终端装置首先根据识别托盘图像的连通域个数,得到菜品数量的信息,并根据PC机已经识别得到的菜品与价格的对应关系,依照单价及数量计算出餐盘所含菜品的总价;步骤S32:将托盘中所含菜品数量、单价及总价显示出来,并显示可供选择的支付方式,供用餐者支付。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910155376.2/,转载请声明来源钻瓜专利网。