[发明专利]一种图书自动分类方法在审
申请号: | 201711323905.2 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108038506A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 罗艳 | 申请(专利权)人: | 四川九鼎智远知识产权运营有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 詹永斌 |
地址: | 610041 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图书 自动 分类 方法 | ||
1.一种图书自动分类方法,其特征为,包括:
S10:识别图书封面文字,得到封面文字信息;
S20:根据所述封面文字信息,在图书数据库中进行匹配,得到图书属性信息;
S30:根据所述图书属性信息中携带的信息,输出图书的分类信息。
2.如权利要求1所述的方法,其特征为,所述S10包括:
S101:获取所述图书封面的图像数据;
S102:对所述图像数据进行定位,得到图书封面图像;
S103:提取所述图书封面图像的特征值,将所述特征值在文字特征值库中匹配出相应文字,得到封面文字信息。
3.如权利要求2所述的方法,其特征为,所述S101具体为:通过拍摄或扫描方式,获取图书封面的图像数据。
4.如权利要求3所述的方法,其特征为,所述S20包括:
S201:将所述封面文字信息按段落进行划分;
S202:将划分的段落依次在图书数据库中进行匹配;若匹配到图书属性信息,则停止匹配后续的段落。
5.如权利要去4所述的方法,其特征为,所述S201具体为:将封面文字信息按在图书封面上文字排版的连续性划分为至少一个段落。
6.如权利要求5所述的方法,其特征为,所述S202中将划分的段落依次在图书数据库中进行匹配具体为:
按划分的段落,依次在图书数据库中的图书名称项、出版社项或作者项进行匹配,在匹配到相应项时,提取所述匹配到的项所对应的图书属性信息。
7.如权利要求6所述的方法,其特征为,所述S103中,提取所述图书封面图像的特征值具体为:
S1031:将所述图书封面图像在横向或纵向进行投影,划分为若干图像块;
S1032:对所述若干图像块进行预处理,输出若干二值化图像块;
S1033:分别提取所述若干二值化图像的特征值。
8.如权利要求7所述的方法,其特征为,所述S202具体为:
识别出划分的第一个图像块的文字,将所述第一个图像块的文字在图书数据库中进行匹配;若未匹配到图书属性信息,则再依次识别出划分的后续图像块的文字,依次将识别出的对应的文字在图书数据库中进行匹配,直到匹配到图书属性信息,则不再识别后续图像块的文字。
9.如权利要求1-8任一所述的方法,其特征为,所述图书数据库为授权的图书出版社数据库,或者为授权的图书代理商数据库。
10.如权利要求9所述的方法,其特征为,所述分类信息包括:图书的题材分类信息、图书的价位分类信息、图书的受众分类信息或图书的评价等级分类信息中的一项或多项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川九鼎智远知识产权运营有限公司,未经四川九鼎智远知识产权运营有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711323905.2/1.html,转载请声明来源钻瓜专利网。