[发明专利]一种基于深度学习与质量影响的图书检索方法有效
申请号: | 202110208083.3 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112948544B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 刘澳;毕家泽;陈祎琼;张玮;姚越 | 申请(专利权)人: | 安徽农业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/383;G06F40/30;G06F40/194;G06N3/04;G06N3/08 |
代理公司: | 合肥中谷知识产权代理事务所(普通合伙) 34146 | 代理人: | 洪玲 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 质量 影响 图书 检索 方法 | ||
本发明涉及一种基于深度学习与质量影响的图书检索方法,包括以下步骤:1)、获取数字图书馆数据库中的数据并提取其中的标准化书名数据和内容关键词句数据,采用类别噪声裁剪算法将提取的数据进行降噪处理;2)、基于深度学习模型对上述步骤1)中降噪处理后的数据进行特征提取和分类并得到图书的语义类信息;3)、基于步骤2)中获取的语义类信息建立语义理解索引数据库。该基于深度学习与质量影响的图书检索方法,可以更好的理解用户真正的检索需求,利用深度学习技术提高了搜索的精细化程度,在保证搜索语义相似度的基础上引入了图书质量识别模型,使得用户在图书馆搜索引擎时最终接收到的结果语义相似度高,同时也保证了图书的质量。
技术领域
本发明属于自然语言处理技术领域,具体涉及一种基于深度学习与质 量影响的图书检索方法。
背景技术
传统的图书馆搜索引擎对自然语言的理解能力有所欠缺,不符合人们 检索问题的惯性思维,对于用户输入的检索的字段只能采用机械式的关键 词匹配。
而且由于文学作品通常含有人类感情,具有特殊性,利用传统关键字 提取算法方法无法准确获取到真正有意义的文章特征,同时,在传统图书 馆搜索引擎中对用户结果仅仅考虑了相似度排序,并未考虑图书质量,导 致搜索结果的精细化程度较低。
发明内容
本发明的目的就在于为了解决上述问题而提供一种结构简单,设计合 理的一种基于深度学习与质量影响的图书检索方法。
本发明通过以下技术方案来实现上述目的:
一种基于深度学习与质量影响的图书检索方法,包括以下步骤:
1)、获取数字图书馆数据库中的数据并提取其中的标准化书名数据和 内容关键词句数据,采用类别噪声裁剪算法将提取的数据进行降噪处理;
2)、基于深度学习模型对上述步骤1)中降噪处理后的数据进行特征 提取和分类并得到图书的语义类信息;
3)、基于步骤2)中获取的语义类信息建立语义理解索引数据库,并 映射到数字图书馆数据库上;
4)、获取用户输入的检索信息,并进行文本预处理;
5)、基于深度学习模型对步骤4)中经文本预处理后的检索信息进行 关键字提取;
6)、基于深度文本匹配模型将步骤5)中提取的关键字与步骤3)中 建立的语义理解索引数据库进行对比,将对比结果按相似度从高到低排序, 截取前n个对比结果形成图书检索结果R1;
7)、建立基于模糊模式的图书质量识别模型,根据图书质量识别模型 对步骤6)中的图书检索结果R1的n个对比结果进行模糊模式的质量识别, 并按照质量识别结果得分从高到低排序,形成图书检索结果R2;
8)、根据可信度计算公式计算图书检索结果R2的可信度r,
其中,b=0.4,Sij是R2中第i本书第j个指标得分,是R2中第i本书 第j个指标在同类图书中的平均得分,wj是图书第j个评价指标的权重, 可信度的判断值CD的范围为0-0.4;
9)、基于步骤6)中的图书检索结果R1、步骤7)中的图书检索结果 R2以及步骤8)中获得的可信度r构造层次结构模型并利用层次结构模型 重新归纳整理图书排序结果,得到图书检索结果R3;
10)、将图书检索结果R3返回至用户,完成基于深度学习的图书检索 过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽农业大学,未经安徽农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110208083.3/2.html,转载请声明来源钻瓜专利网。