[发明专利]基于书脊视觉信息的图书识别方法及系统在审
申请号: | 202011383651.5 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112560902A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 孙坦;周硕;柴秀娟;张文蓉;鲜国建 | 申请(专利权)人: | 中国农业科学院农业信息研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国 |
地址: | 100081 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 书脊 视觉 信息 图书 识别 方法 系统 | ||
1.一种基于书脊视觉信息的图书识别方法,其特征在于,包括:
步骤1、获取已标注书脊分割的图书书脊图片作为训练集,通过该训练集训练用于分割书脊的深度卷积神经网络模型,得到书脊分割模型,使用该书脊分割模型,对采集的架上书本图片做实例分割,得到多张书脊图片;
步骤2、通过为每张书脊图片标注图书类别,构建书脊分类数据集,通过该书脊分类数据集训练用于书脊分类的深度卷积神经网络模型,得到书脊特征提取模型,使用该书脊特征提取模型提取图书数据库中每一本书的书脊视觉特征,集合书脊视觉特征构建书脊视觉数据库;
步骤3、将包含多个书脊的待识别书脊图片输入至书脊分割模型进行实例分割,并将分割结果输入至该书脊特征提取模型,得到该待识别书脊图片中各书脊的视觉特征向量,将该视觉特征向量与数据库匹配以识别该待识别书脊图片中各书脊的图书类别。
2.如权利要求1所述的基于书脊视觉信息的图书识别方法,其特征在于,该步骤1包括数据集构建步骤,使用图片采集设备对架上图书进行多角度拍摄,并在拍摄结果中每个书脊区域确定四个坐标点(xN,yN)i,N∈[1,4]构成一个封闭的四边形bi将其框选,以标注书脊分割。
3.如权利要求1所述的基于书脊视觉信息的图书识别方法,其特征在于,该步骤2包括图书类别标注步骤,获得图书书脊图片中所有的书脊区域Bi,获取书脊区域Bi的最小外接矩形Ri的四个顶点(XN,YN)i,N∈[1,4]以及Ri长边的倾斜角度θi,将原图进行仿射变换旋转θi后再根据(XN,YN)i,N∈[1,4]裁切得到规整的书脊图片BEi,人工对书脊图片BEi标注类别标签,其中同一本书的书脊图片拥有相同的标签。
4.如权利要求1所述的基于书脊视觉信息的图书识别方法,其特征在于,该步骤2中用于书脊分类的深度卷积神经网络模型的构建方法包括:使用残差模块构建多层的深度卷积神经网络作为特征提取网络m2,特征提取网络m2末端添加一个使用加性角度间隔损失函数的全连接分类层classifier,得到该用于书脊分类的深度卷积神经网络模型的结构;
该步骤2包括使用该书脊分类数据集,按照分类任务的范式训练模型M2=m2+classifier:输入缩放为固定大小的书脊图片,训练输出书脊图片所属标签,M2训练完成以后将模型中特征提取网络m2输出的特征图Fi作为书脊的视觉特征向量。
5.如权利要求4所述的基于书脊视觉信息的图书识别方法,其特征在于,该步骤3包括将该待识别书脊图片送入该书脊分割模型中处理,得到该待识别书脊图片中所有图书的书脊图片BEi;在识别过程中,使用余弦相似度度量两个书脊视觉表征向量Fa=[a1,a2,…,a512]与Fb=[b1,b2,…,b512]之间的相似程度;书脊特征提取模型m2计算每一个书脊图片BEi的视觉表征Fi,将其与脊视觉数据库中的数据做最近邻搜索,得到脊视觉数据库中与目标书脊图片相似度最高的多个书脊类别id信息,其中相似度最高的类别id信息作为最终识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业信息研究所,未经中国农业科学院农业信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011383651.5/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置