[发明专利]一种文档质量评价方法及计算设备在审
申请号: | 202310450781.3 | 申请日: | 2023-04-24 |
公开(公告)号: | CN116629241A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 刘震 | 申请(专利权)人: | 超聚变数字技术有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/211;G06F40/253;G06F40/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 刘方 |
地址: | 450000 河南省郑州市郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 质量 评价 方法 计算 设备 | ||
本申请实施例提供了一种文档质量评价方法及计算设备,方法包括:获取待检测文档的评价数据;基于评价数据得到至少一个目标文本片段;从多个评价维度将至少一个目标文本片段和评价词典进行匹配,得到匹配结果,匹配结果包括多个评价维度对应的匹配信息;其中,每个评价维度对应的匹配信息包括匹配文本片段和匹配文本片段对应的评价参数,评价词典包括至少一个参考文本片段;评价参数用于指示每个匹配文本片段所描述的文档内容的优势特征或者劣势特征的得分;根据匹配结果确定待检测文档的质量评价数据;其中,质量评价数据包括多个评价维度对应的质量分数。通过上述方法,可以提高对文档进行质量评价的准确性。
技术领域
本申请涉及服务器技术领域,尤其涉及一种文档质量评价方法及计算设备。
背景技术
产品文档是一种介绍诸如产品功能特性、如何使用、如何处理故障等信息的文档。互联网上发布的产品文档数量众多,文档作者或使用者需要了解文档质量怎么样,例如文档哪些部分用户认可度高,哪些部分用户认可度低,因此需要对文档进行质量评价。
目前,通过评价模型对文档的质量进行评分,但该评分是文档整体质量对应的评分,粒度较为粗糙,导致文档质量评价的准确性较低。并且,不同用户对文档质量的理解不一致,使得训练出的评分模型的客观度不足。因此,如何提高对文档进行质量评价的准确性是一个亟待解决的问题。
发明内容
本申请实施例提供一种文档质量评价方法及计算设备,可以提高对文档进行质量评价的准确性。
第一方面,本申请实施例提供了一种文档质量评价方法,方法包括:
获取待检测文档的评价数据;
基于评价数据得到至少一个目标文本片段;
从多个评价维度将至少一个目标文本片段和评价词典进行匹配,得到匹配结果;匹配结果包括多个评价维度对应的匹配信息,其中,每个评价维度对应的匹配信息包括匹配文本片段和匹配文本片段对应的评价参数,评价词典包括至少一个参考文本片段;评价参数用于指示每个匹配文本片段所描述的文档内容的优势特征或者劣势特征的得分;
根据匹配结果确定待检测文档的质量评价数据;其中,质量评价数据包括多个评价维度对应的质量分数。
在一种可实现方式中,评价词典包括每个评价维度对应的子词典;
从多个评价维度将至少一个目标文本片段和评价词典进行匹配,得到匹配结果,包括:
将至少一个目标文本片段和目标评价维度对应的目标子词典中的参考文本片段进行匹配,得到与至少一个目标文本片段匹配的匹配文本片段;匹配文本片段包括正向文本片段和负向文本片段;其中,目标评价维度为多个评价维度中的任意一个,正向文本片段用于描述待检测文档的内容的优势特征,负向文本片段用于描述待检测文档的内容的劣势特征;
从评价参数对照数据中确定匹配文本片段对应的评价参数;
基于匹配文本片段和匹配文本片段对应的评价参数确定目标评价维度对应的匹配信息;
基于多个评价维度对应的匹配信息确定匹配结果。
通过该实现方式,使得管理服务器可以针对每一个评价维度从待检测文档的内容的优势特征和劣势特征两方面进行文档质量评分,从而提高待检测文档的质量分数的准确性。
在一种可实现方式中,根据匹配结果确定待检测文档的质量评价数据,包括:
从目标评价维度对应的匹配信息中确定每个正向文本片段对应的评价参数,以及每个负向文本片段对应的评价参数;
基于每个正向文本片段和每个正向文本片段对应的评价参数确定正向评价参数;
基于每个负向文本片段和每个负向文本片段对应的评价参数确定负向评价参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超聚变数字技术有限公司,未经超聚变数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310450781.3/2.html,转载请声明来源钻瓜专利网。