[发明专利]一种室内商场店铺特征提取方法在审
申请号: | 201711167137.6 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107832727A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 方璐;徐子威;郑海天;庞敏健;苏雄飞;王好谦 | 申请(专利权)人: | 深圳市未来媒体技术研究院;清华大学深圳研究生院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F17/50;G06N3/04 |
代理公司: | 深圳新创友知识产权代理有限公司44223 | 代理人: | 余敏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 室内 商场 店铺 特征 提取 方法 | ||
【技术领域】
本发明涉及计算机视觉与数字图像处理领域,特别是涉及一种基于高级视觉特征的室内商场店铺特征提取方法。
【背景技术】
在缺乏便携、低成本的定位系统(如用于室外定位的GPS)的室内环境中,室内定位系统(IPS)一直是一个有吸引力的研究课题。使用基于基础设备的室内定位系统包括使用RFID的,使用日光灯或Wi-Fi接入点的,这些系统在实际应用中的表现令人印象深刻。另一方面,不依赖于基础设施的IPS本身具有的优越性和挑战性引起了更加广泛的关注。现有的方法采用图像检索技术提出了基于计算机视觉的IPS,这些系统可以通过智能手机拍摄的照片告诉用户的位置。然而,所有这些方法都需要事先进行离线数据库构建,这一过程相当耗时且昂贵。
近年来,机器人学和计算机视觉方面的最新进展在IPS上又有了新的应用。同步定位和地图构建(SLAM)技术和视觉测距(VO)由于可以准确估计运动而成为IPS的重要技术。使用词袋模型的单目SLAM系统、单目VO算法和基于LIDAR的系统已经在实际系统中得到应用。然而,运行SLAM或VO意味着用户必须通过摄像机或激光收发器录制视频。
为了解决这个问题,有学者提出基于图像中的文本识别方法进行商场定位。具体来说,这一系统将图像中的商店通过文本识别进行分类,并且用作粗略定位的地标(即通过商店分类进行定位)。这种方法具有灵活可扩展性,因为除了需要预先标记的商场平面图作为输入之外,不需要事先收集大量关于室内场景的数据。但是,仅仅通过文本识别店铺精度并不高,因为在实际环境中,许多文字淹没在噪声中难以检测。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
【发明内容】
本发明所要解决的技术问题是:弥补上述现有技术的不足,提出一种室内商场店铺特征提取方法,可显著提高店铺识别的准确度。
本发明的技术问题通过以下的技术方案予以解决:
一种室内商场店铺特征提取方法,所述商场内包括M个店铺;包括以下步骤:S1,构建店铺装饰风格识别神经网络原型,所述装饰风格识别神经网络原型包括卷积层、池化层、激励层和全连接层;S2,构建店铺文字检测神经网络原型,所述文字检测神经网络原型包括卷积层、池化层、激励层和反卷积层;S3,建立该商场内的店铺图像数据集,各图像均包括店铺的文字信息和装饰风格信息,将图像数据集划分为训练集和测试集;通过高斯随机分布初始化所述装饰风格识别神经网络和文字检测神经网络的权值,以最小化代价函数为目标来训练步骤S1中的装饰风格识别神经网络原型和步骤S2中的文字检测神经网络原型,确定出店铺装饰风格识别神经网络和文字检测神经网络的模型结构;S4,对于一张包含店铺名称和内部装饰风格的待识别图片,分别将其输入所述店铺装饰风格神经网络和文字检测神经网络的模型结构中,得到该图片属于各个店铺的概率以及该图片中对应文字部分的区域;S5,将步骤S4中得到的该图片中对应文字部分的区域输入文字识别模块中,得到该图片中文字部分对应的NGRAM编码;S6,根据步骤S4中得到的概率计算店铺装饰风格识别概率,根据步骤S5中得到的NGRAM编码计算文字识别概率,利用加权得到最终对应M个店铺的识别概率,以得到的概率中最高概率值对应的店铺作为该图片的店铺识别结果。
本发明与现有技术对比的有益效果是:
本发明的室内商场店铺特征提取方法,基于高级视觉特征进行店面识别,通过构建神经网络以及以大量店铺图像数据集进行训练确定得到装饰风格识别神经网络和文字检测神经网络,使用上述神经网络获取待测图片中的店铺的装饰风格信息以及图片中的文字区域,并结合文字区域识别店铺中的文字信息(NGRAM编码),然后将装饰风格信息和文字信息这两种信息进行融合以识别当前店铺。店铺装饰风格和文字信息的融合显著提高了店铺识别的准确度,使得基于该融合结果的室内商场定位也能够更加健壮。
【附图说明】
图1是本发明具体实施方式的室内商场店铺特征提取方法的框架示意图;
图2是本发明具体实施方式的室内商场店铺特征提取方法的流程图;
图3是本发明具体实施方式中的装饰风格识别神经网络的具体模型结构的示意图;
图4是本发明具体实施方式中的店铺文字检测神经网络的具体模型结构的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市未来媒体技术研究院;清华大学深圳研究生院,未经深圳市未来媒体技术研究院;清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711167137.6/2.html,转载请声明来源钻瓜专利网。