[发明专利]一种基于人工智能的图书分类方法在审
申请号: | 201810554466.4 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108875808A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 高桂玲;折宇超 | 申请(专利权)人: | 延安职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 716000*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 成熟模型 人工智能 图书分类 转化 读取 工作自动化 工作效率 特征向量 拼音 分类 节约 | ||
1.一种基于人工智能的图书分类方法,其特征在于,包括如下步骤:
步骤一、对于现有的图书进行成熟模型训练;
首先读取所有图书的名称及对应书架并将图书名称转化为拼音,通过n-gram结合word2Vec或者TF-IDF进行分词形成特征向量,其中,n为大于等于1的正整数,然后根据书架所属的图书种类个数确定分类个数;
将已有图书的特征向量及对应的书架号分为3块,比例分别为6∶2∶2.其中60%用于训练模型,20%用于测试训练精度并不断调整模型已使测试精度达到最高,剩余的20%用于实际测量精度;此时,通过模型库中的模型对60%的图书数据图书特征向量进行分类,得出训练模型并使用20%的数据作为测试数据对模型进行评测,得到精度最高的模型,并用剩余20%的数据进行实测,选择此时精度最高的模型作为成熟模型;
步骤二、当新进图书时,首先读取所有新进图书的图书名称,并将其转化为拼音,将其按照成熟模型中的分册的方法转化进一步转化为特征向量,然后使用成熟模型对图书进行分类,得到新图书所属的书架号。
2.如权利要求1所述的一种基于人工智能的图书分类方法,其特征在于,所述步骤一选用随机森林作为分类器进行训练得到成熟模型;首先提取对已有图书的拼音和对应的书架,对拼音进行n-gram划分,对于划分出的字母组合使用word2vec或者TF-IDF进行数字变换,变换后按3∶1∶1分成第一份、第二份、第三份,然后按照如下步骤进行模型调优:
S1、调节随机森林模型参数,包括但不限于树的最大深度和树的最大数量,调节完毕后使用第一份数据进行训练并使用评估函数进行评估,选出最优值;
S2、使用第二份数据对模型进行评测,通过评估函数进行评估并修正模型;
S3、重复执行步骤S1-步骤S2,直到满足条件为止;
确定模型之后使用第三份数据进行实测,则此时的评估函数则为实测值。
3.如权利要求1所述的一种基于人工智能的图书分类方法,其特征在于,所述步骤一选用神经网络甚至深度学习网络作为分类器进行训练得到成熟模型;按如下顺序进行:
S1、提取对已有图书的拼音和对应的书架,对拼音进行n-gram划分,对于划分出的字母组合使用word2vec或者TF-IDF进行数字变换,变换后按3∶1∶1分成第一份、第二份、第三份;
S2、确定神经网络参数并调优,包括但不限于输入特征值、输出分类个数、
隐藏层个数、隐藏节点函数,使用第二份数据对模型进行评测,即输入拼音,输出分类书架结果,通过评估函数进行评估并修正模型;
S3、重复执行步骤S1-步骤S2,直到满足条件为止;
确定模型之后使用第三份数据进行实测,则此时的评估函数为实测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于延安职业技术学院,未经延安职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810554466.4/1.html,转载请声明来源钻瓜专利网。