[发明专利]一种基于深度学习与质量影响的图书检索方法有效
申请号: | 202110208083.3 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112948544B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 刘澳;毕家泽;陈祎琼;张玮;姚越 | 申请(专利权)人: | 安徽农业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/383;G06F40/30;G06F40/194;G06N3/04;G06N3/08 |
代理公司: | 合肥中谷知识产权代理事务所(普通合伙) 34146 | 代理人: | 洪玲 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 质量 影响 图书 检索 方法 | ||
1.一种基于深度学习与质量影响的图书检索方法,其特征在于,包括以下步骤:
1)、获取数字图书馆数据库中的数据并提取其中的标准化书名数据和内容关键词句数据,采用类别噪声裁剪算法将提取的数据进行降噪处理;
2)、基于深度学习模型对上述步骤1)中降噪处理后的数据进行特征提取和分类并得到图书的语义类信息;
3)、基于步骤2)中获取的语义类信息建立语义理解索引数据库,并映射到数字图书馆数据库上;
4)、获取用户输入的检索信息,并进行文本预处理;
5)、基于深度学习模型对步骤4)中经文本预处理后的检索信息进行关键字提取;
6)、基于深度文本匹配模型将步骤5)中提取的关键字与步骤3)中建立的语义理解索引数据库进行对比,将对比结果按相似度从高到低排序,截取前n个对比结果形成图书检索结果R1;
7)、建立基于模糊模式的图书质量识别模型,根据图书质量识别模型对步骤6)中的图书检索结果R1的n个对比结果进行模糊模式的质量识别,并按照质量识别结果得分从高到低排序,形成图书检索结果R2;
其中,建立基于模糊模式的图书质量识别模型具体包括:
71)确定质量分类集G={G1,G2,G3,G4,G5}={好,较好,一般,较差,差},根据图书数量n=50进行量化后得出G={50,40,30,20,10};
72)确定质量评价指标集S={S1,S2,S3,S4,S5,S6},其中S1为DNN语言模型得分,S2为第三方网站1评分,S3为第三方网站2评分,S4为同类图书借阅量评分,S5为同类图书电机浏览量评分,S6为用户评价情感得分;
73)确定图书质量分类对评价指标的模糊关系矩阵,将质量评价指标按其重要程度划分为五个等级,再对其进行归一化处理;
74)将需识别图书按1-9标度法对个评价指标进行标度并归一化处理,得到模糊集A;
75)将得到的所述模糊集A与质量分类{好,较好,一般,较差,差}的标度值分别用格贴近度N1(A,G)=(A·G)^(A×G)C、内外积贴近度最大最小贴近度进行模糊计算,根据则近原则找到图书归属类别;
8)、根据可信度计算公式计算图书检索结果R2的可信度r,
其中,b=0.4,Sij是R2中第i本书第j个指标得分,是R2中第i本书第j个指标在同类图书中的平均得分,wj是图书第j个评价指标的权重,可信度的判断值CD的范围为0-0.4;
9)、基于步骤6)中的图书检索结果R1、步骤7)中的图书检索结果R2以及步骤8)中获得的可信度r构造层次结构模型并利用层次结构模型重新归纳整理图书排序结果,得到图书检索结果R3;
10)、将图书检索结果R3返回至用户,完成基于深度学习的图书检索过程。
2.根据权利要求1所述的一种基于深度学习与质量影响的图书检索方法,其特征在于:利用深度学习模型获取图书的语义类信息,具体为,基于skip-gram模型的词嵌入表示方法获得分布式词向量,采用BiLSTM与Attention机制结合的方式进行文本分类,对输出结果进行拼接并得到语义信息,再结合Attention机制在每一层给不同词训练不同的权重,加权得到不同句子对整段文本的语义影响程度并最终得到图书的语义类信息。
3.根据权利要求1所述的一种基于深度学习与质量影响的图书检索方法,其特征在于:所述步骤6)中n的数值为50。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽农业大学,未经安徽农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110208083.3/1.html,转载请声明来源钻瓜专利网。