[发明专利]一种评价查新报告质量的模型建立方法及应用方法有效
申请号: | 201510890524.7 | 申请日: | 2015-12-07 |
公开(公告)号: | CN105468920B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 张素香;袁彩霞;吕俊峰;李国春;王小捷;张东;高德荃 | 申请(专利权)人: | 国家电网公司信息通信分公司;北京邮电大学;国家电网公司 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100761 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评价 报告 质量 模型 建立 方法 应用 | ||
本发明公开了一种评价查新报告质量的模型建立方法,包括:抽取多篇查新报告对应的检索式、相关文献和查新结论;根据各检索式、相关文献和查新结论获取查新报告对应的特征参数;获取专家对查新报告的打分信息;采用线性回归模型的方式建立所述特征参数与所述打分信息的关系;采用梯度下降法对使用所述特征参数和所述打分信息建立的线性回归模型进行训练得到所述评价查新报告质量的模型。由此可见,上述过程中,只需要专家对选取的有限数量的查新报告进行打分,并且该模型可以应用到其它待评价的查新报告中,因此,节约人力成本。此外,本发明还提供一种评价查新报告质量的模型应用方法。
技术领域
本发明涉及科技文献查新技术领域,特别是涉及一种评价查新报告质量的模型建立方法及应用方法。
背景技术
随着对科技文献查新的需求不断增加,对科技文献查新工作的要求不断提升,亟需一种定量的评价科技查新报告质量的方法,以客观地评价查新员查新工作的质量,并提升对查新员查新工作的管理水平。
查新报告通俗讲是在现有的文献记载中对给定的文献所做的检索工作,例如,对给定的文献进行查重等,通过一定的检索工作对给定的文献做出相关的报告,例如重复性、相似性、创新性等。由于查新报告是对给定的文献所做的总结性报告,因此,对查新报告的质量提出了较高的要求。
现有的查新报告评价方法中,都建立在专家打分的基础上,例如模糊综合评判模型、层次分析法、熵权法都属于基于专家打分的方法。工作流程如下:
第一步,采集N(通常N≤10)篇查新报告,设定M(通常M≤15)个评价指标;
第二步,邀请专家为每篇报告的M个评价指标逐个打分,得到一个N*M的矩阵A;
第三步,通过矩阵分析,判断M个指标的重要程度,并赋予其权重;
第四步,对于第N+1个查新报告,专家在M个评价指标对其进行的打分,按照第三步中求解得到的指标权重,对M个打分进行加权求和,即得到本篇查新报告的质量。
对于上述方法,其严格依赖于人类专家在不同指标下的打分,尽管可以从打分矩阵中自动求解得到不同指标的权重,但是专家打分的主观性会直接影响到评价结果的客观与合理。同时,这一类方法不能适用于大规模的查新报告质量评估工作。此外,当查新报告量较多时,需要的人工成本会非常大。
由此可见,当评价查新报告质量时,如何提高客观性和准确性,以及降低人工成本是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种评价查新报告质量的模型建立方法,用于当评价查新报告质量时,如何提高客观性和准确性,以及降低人工成本。
为解决上述技术问题,本发明提供一种评价查新报告质量的模型建立方法,包括:
抽取多篇查新报告对应的检索式、相关文献和查新结论;
根据各所述检索式、所述相关文献和所述查新结论获取所述查新报告对应的特征参数;
获取专家对所述查新报告的打分信息;
采用线性回归模型的方式建立所述特征参数与所述打分信息的关系;
采用梯度下降法对使用所述特征参数和所述打分信息建立的线性回归模型进行训练得到所述评价查新报告质量的模型。
优选地,所述特征参数包括:
所述查新报告的检索式与查新项目的相关度;
所述查新报告的相关文献与所述查新项目的相关度;
所述查新报告的相关文献的权威度;
所述查新报告的相关文献的准确率;
所述查新报告的相关文献的召回率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司信息通信分公司;北京邮电大学;国家电网公司,未经国家电网公司信息通信分公司;北京邮电大学;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510890524.7/2.html,转载请声明来源钻瓜专利网。