[发明专利]一种基于人工智能的图书分类方法在审

专利信息
申请号: 201810554466.4 申请日: 2018-05-17
公开(公告)号: CN108875808A 公开(公告)日: 2018-11-23
发明(设计)人: 高桂玲;折宇超 申请(专利权)人: 延安职业技术学院
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 716000*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 成熟模型 人工智能 图书分类 转化 读取 工作自动化 工作效率 特征向量 拼音 分类 节约
【说明书】:

发明公开了一种基于人工智能的图书分类方法,包括如下步骤:步骤一、对于现有的图书进行成熟模型训练;步骤二、当新进图书时,首先读取所有新进图书的图书名称,并将其转化为拼音,将其按照成熟模型中的分册的方法转化进一步转化为特征向量,然后使用成熟模型对图书进行分类,得到新图书所属的书架号。本发明大大提高了图书管理员的工作效率,使得简单、繁琐的工作自动化,节约时间。

技术领域

本发明涉及人工智能领域,具体涉及一种基于人工智能的图书分类方法。

背景技术

目前,采集回来的图书在分类时均通过人工进行分类,占用的图书管理员大量的时间和精力,厄需提供一种基于人工智能的图书分类方法。

发明内容

为解决上述问题,本发明提供了一种基于人工智能的图书分类方法,大大提高了图书管理员的工作效率,使得简单、繁琐的工作自动化,节约时间。

为实现上述目的,本发明采取的技术方案为:

一种基于人工智能的图书分类方法,包括如下步骤:

步骤一、对于现有的图书进行成熟模型训练

首先读取所有图书的名称及对应书架并将图书名称转化为拼音,通过n-gram结合word2Vec或者TF-IDF进行分词形成特征向量,其中,n为大于等于1的正整数,通常取n=3,然后根据书架所属的图书种类个数确定分类个数;

将已有图书的特征向量及对应的书架号分为3块,比例分别为6∶2∶2.其中60%用于训练模型,20%用于测试训练精度并不断调整模型已使测试精度达到最高,剩余的20%用于实际测量精度;此时,通过模型库中的模型对60%的图书数据图书特征向量进行分类,得出训练模型并使用20%的数据作为测试数据对模型进行评测,得到精度最高的模型,并用剩余20%的数据进行实测,选择此时精度最高的模型作为成熟模型;

步骤二、当新进图书时,首先读取所有新进图书的图书名称,并将其转化为拼音,将其按照成熟模型中的分册的方法转化进一步转化为特征向量,然后使用成熟模型对图书进行分类,得到新图书所属的书架号。

优选地,所述步骤一选用随机森林作为分类器进行训练得到成熟模型;首先提取对已有图书的拼音和对应的书架,对拼音进行n-gram划分,其中,n为大于等于1的正整数,通常取n=3,对于划分出的字母组合使用word2vec或者TF-IDF进行数字变换,变换后按3∶1∶1分成第一份、第二份、第三份,然后按照如下步骤进行模型调优:

S1、调节随机森林模型参数,包括但不限于树的最大深度和树的最大数量,调节完毕后使用第一份数据进行训练并使用评估函数进行评估,选出最优值;

S2、使用第二份数据对模型进行评测,通过评估函数进行评估并修正模型;

S3、重复执行步骤S1-步骤S2,直到满足条件为止;

确定模型之后使用第三份数据进行实测,则此时的评估函数则为实测值。

优选地,所述步骤一选用神经网络甚至深度学习网络作为分类器进行训练得到成熟模型;按如下顺序进行:

S1、提取对已有图书的拼音和对应的书架,对拼音进行n-gram划分,其中,n为大于等于1的正整数,通常取n=3,对于划分出的字母组合使用word2vec或者TF-IDF进行数字变换,变换后按3∶1∶1分成第一份、第二份、第三份;

S2、确定神经网络参数并调优,包括但不限于输入特征值、输出分类个数、隐藏层个数、隐藏节点函数,使用第二份数据对模型进行评测,即输入拼音,输出分类书架结果,通过评估函数进行评估并修正模型;

S3、重复执行步骤S1-步骤S2,直到满足条件为止;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于延安职业技术学院,未经延安职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810554466.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top