[发明专利]一种基于人工智能的图书分类方法在审

申请号：	201810554466.4	申请日：	2018-05-17
公开（公告）号：	CN108875808A	公开（公告）日：	2018-11-23
发明（设计）人：	高桂玲;折宇超	申请（专利权）人：	延安职业技术学院
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	716000***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	成熟模型人工智能图书分类转化读取工作自动化工作效率特征向量拼音分类节约
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于人工智能的图书分类方法，其特征在于，包括如下步骤：

步骤一、对于现有的图书进行成熟模型训练；

首先读取所有图书的名称及对应书架并将图书名称转化为拼音，通过n-gram结合word2Vec或者TF-IDF进行分词形成特征向量，其中，n为大于等于1的正整数，然后根据书架所属的图书种类个数确定分类个数；

将已有图书的特征向量及对应的书架号分为3块，比例分别为6∶2∶2.其中60％用于训练模型，20％用于测试训练精度并不断调整模型已使测试精度达到最高，剩余的20％用于实际测量精度；此时，通过模型库中的模型对60％的图书数据图书特征向量进行分类，得出训练模型并使用20％的数据作为测试数据对模型进行评测，得到精度最高的模型，并用剩余20％的数据进行实测，选择此时精度最高的模型作为成熟模型；

步骤二、当新进图书时，首先读取所有新进图书的图书名称，并将其转化为拼音，将其按照成熟模型中的分册的方法转化进一步转化为特征向量，然后使用成熟模型对图书进行分类，得到新图书所属的书架号。

2.如权利要求1所述的一种基于人工智能的图书分类方法，其特征在于，所述步骤一选用随机森林作为分类器进行训练得到成熟模型；首先提取对已有图书的拼音和对应的书架，对拼音进行n-gram划分，对于划分出的字母组合使用word2vec或者TF-IDF进行数字变换，变换后按3∶1∶1分成第一份、第二份、第三份，然后按照如下步骤进行模型调优：

S1、调节随机森林模型参数，包括但不限于树的最大深度和树的最大数量，调节完毕后使用第一份数据进行训练并使用评估函数进行评估，选出最优值；

S2、使用第二份数据对模型进行评测，通过评估函数进行评估并修正模型；

S3、重复执行步骤S1-步骤S2，直到满足条件为止；

确定模型之后使用第三份数据进行实测，则此时的评估函数则为实测值。

3.如权利要求1所述的一种基于人工智能的图书分类方法，其特征在于，所述步骤一选用神经网络甚至深度学习网络作为分类器进行训练得到成熟模型；按如下顺序进行：

S1、提取对已有图书的拼音和对应的书架，对拼音进行n-gram划分，对于划分出的字母组合使用word2vec或者TF-IDF进行数字变换，变换后按3∶1∶1分成第一份、第二份、第三份；

S2、确定神经网络参数并调优，包括但不限于输入特征值、输出分类个数、

隐藏层个数、隐藏节点函数，使用第二份数据对模型进行评测，即输入拼音，输出分类书架结果，通过评估函数进行评估并修正模型；

S3、重复执行步骤S1-步骤S2，直到满足条件为止；

确定模型之后使用第三份数据进行实测，则此时的评估函数为实测值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载