[发明专利]一种图书自动分类装置在审

专利信息
申请号: 201711323904.8 申请日: 2017-12-13
公开(公告)号: CN107944030A 公开(公告)日: 2018-04-20
发明(设计)人: 罗艳 申请(专利权)人: 四川九鼎智远知识产权运营有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06K9/34;G06K9/62
代理公司: 成都九鼎天元知识产权代理有限公司51214 代理人: 詹永斌
地址: 610041 四川省成都市高新*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图书 自动 分类 装置
【说明书】:

技术领域

发明涉及信息管理领域,尤其是一种图书自动分类装置。

背景技术

基于电子科技技术的发展和推广,数字化办公已越来越受到用户的青睐,相对于传统的纸质化办公,数字化办公具有效率高、易管理和环保等优势。而基于长久的数字化办公,在阅读方面,人们也越来越倾向于网络的推荐和检索。

在大众阅读的良好环境下,各地区也相应建设了如图书馆等供公众借阅图书的场所,而在建设该类场所的同时,因考虑到需要存入大量的图书,这就需要大量的工作量以对图书进行相应的归类和存放,即同种类别的图书需要放入相应的书柜中,以便查阅。

而对于如何将图书进行分类,在传统方式中,为人工分类,或者人工借助扫码设备对图书进行分类。在一方面,条形码也仅能显示图书在专业上的分类,对于其他分类信息是无法得知的。因此,通过扫描也仅能实现在专业上的分类。该种分类方式下,需要该图书的信息已写入扫码数据库,进一步的,还需要该图书已登记有条形码。因此,该种分类方式存在效率不高和分类信息不丰富的缺陷,对于受众在选择上,无法提供相应的参考信息。。

发明内容

本发明的发明目的在于:针对上述存在的问题,提供一种自动实现对图书进行快速分类的方案,解决扫码方式不能全覆盖图书信息的问题,同时,还解决通过人工分类效率较低的问题。

本发明采用的技术方案如下:

一种图书自动分类装置,包括依次连接的:图像采集器、文字识别器、文字匹配电路和信息提取电路,其中:

图像采集器,被配置为:采集图书封面的图像数据,传递给文字识别器;

文字识别器,被配置为:识别所述图像数据的图书封面文字,输出封面文字信息给文字匹配电路;

文字匹配电路,被配置为:接收所述封面文字信息,根据所述封面文字信息,在图书数据库中匹配出图书属性信息输出给信息提取电路;

信息提取电路,被配置为:从所述图书属性信息中,提取出图书的分类信息。

进一步,上述分类信息包括:图书的题材分类信息、图书的价位分类信息、图书的受众分类信息或图书的评价等级分类信息中的一项或多项。

虽然图书可能会未注册条形码,但图书的封面都会有图书的名称等信息。通过获取图书的封面文字信息(包含相应的图书名称等信息),再基于图书数据库查找出相应的属性信息,再对应于分类依据(如专业、价位等)进行相应分类,从而丰富了分类种类,进一步,实现自动的图书分类。

作为优选,上述文字识别器包括依次连接的图像处理电路、特征值提取电路和特征值匹配电路,其中:

图像处理电路,被配置为:对所述图像数据进行预处理,输出图书封面图像给特征值提取电路;

特征值提取电路,被配置为:提取所述图书封面图像的特征值,输出给特征值匹配电路;

特征值匹配电路,被配置为:将接收的所述特征值在文字特征值库中匹配出相应文字,输出封面文字信息。

进一步的,预处理包括:封面图像定位、边缘提取和二值化处理,或者还包括形态学处理。该形态学处理包括腐蚀处理和膨胀处理,分别为消除平滑噪声和突出特征部分。

作为优选,图像采集器为摄像设备或扫描设备。

作为优选方案,上述特征值匹配电路包括段落划分模块电路,和连接该段落划分模块电路和文字特征值库的库匹配模块电路,其中:

库匹配模块电路,被配置为:将接收的所述特征值依次在文字特征值库中匹配出相应文字,将识别的文字输出给段落划分模块电路;即识别封面上的文字;

段落划分模块电路,被配置为:接收所述库匹配模块电路发送的文字,根据图书封面图像中文字的排版,将接收的文字依次划分为若干段落,输出划分成若干段落的封面文字信息;即将封面上的文字按在封面上的排版,划分开来;

所述文字匹配电路被配置为:将接收的所述封面文字信息,按划分的段落依次在图书数据库中匹配到图书属性信息时,停止匹配后续段落,将图书属性信息输出给信息提取电路。

按划分的段落进行信息匹配,可有效增加匹配的准确率,同时,减少全文匹配的计算量。

进一步的,,段落划分模块电路被配置为:根据图书封面图像中文字排版的连续性,在文字非连续处添加间隔标识符;

所述文字匹配电路被配置为:接收封面文字信息,依次每连续两个间隔标识符间的文字在图书数据库中匹配到图书属性信息时,停止匹配后续文字的匹配,将图书属性信息输出给信息提取电路。

作为优选,图书数据库包含相互关联的图书名称项、出版社项和作者项,所述相互关联的图书名称项、出版社项和作者项对应于同一图书属性信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川九鼎智远知识产权运营有限公司,未经四川九鼎智远知识产权运营有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711323904.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top