[发明专利]一种裁判文书质量评测的方法和装置有效
申请号: | 202110163510.0 | 申请日: | 2021-02-05 |
公开(公告)号: | CN113378542B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 杨哲;艾中良;李灿;贾高峰 | 申请(专利权)人: | 中国司法大数据研究院有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/295;G06F40/284;G06F40/289;G06F16/35;G06N3/04;G06Q10/06;G06Q50/18 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100070 北京市丰台区南四*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 裁判 文书 质量 评测 方法 装置 | ||
1.一种裁判文书质量评测的方法,其特征在于,包括以下步骤:
录入待评测的目标裁判文书;
对目标裁判文书进行解析;
对解析得到的内容进行指标分析,所述指标分析包括错别字筛查、格式完整性分析、内容规范性分析、法条援引准确性分析、内容逻辑性分析;
根据指标分析的结果进行指标项得分计算;
根据各指标项得分计算目标裁判文书的质量的综合评测得分;
所述错别字筛查,包括以下步骤:
1)利用分词器对目标文书S进行分词,分词后得到的文书元素记为Si;
2)计算文书元素Si的上下文语境的搭配关联度T;搭配关联度T的计算方法是:
其中,TL和TR分别代表元素Si与上文的左关联度和与下文的右关联度;表示元素Si和上文语境(S1,S2,S3,...,Si-1)组合在语境中出现的概率表示元素Si和下文语境(Si+1,Si+2,Si+3,...,Sn)组合在语境中出现的概率Kmax为词汇组合出现概率的最大值;
3)对搭配关联度T低于阈值的元素,利用词向量得出与元素Si的语义最接近的词S'并将其放入原始的语境中,再次计算其搭配关联度T';
4)计算Si所在上下文语境的概率根据条件概率公式,Si所在上下文语境的概率的计算方法是:
其中,Si-M、Si+M分别表示与当前词Si前后距离为M的词;
5)运用综合搭配关联度和概率的错别字检测函数来判断评论中是否含有错别字,的计算公式如下:
其中,λ1、λ2表示搭配关联度和概率所占比重,0λ11,0λ21。
2.根据权利要求1所述的方法,其特征在于,所述录入待评测的目标裁判文书,包括:上传裁判文书;或者根据输入的案号自动获取对应的裁判文书。
3.根据权利要求1所述的方法,其特征在于,所述对目标裁判文书进行解析,包括:采用规则识别结合机器学习模型识别的方式分别解析出基本信息、当事人信息、审理经过、诉辩称内容、本院认为内容、裁判结果内容。
4.根据权利要求1所述的方法,其特征在于,所述格式完整性分析和所述内容规范性分析,采用命名实体识别技术结合预设规则的方法,对目标裁判文书的格式和基本信息、当事人信息、审理经过、诉辩称内容、本院认为内容、裁判结果内容进行格式完整性和内容规范性检查;所述法条援引准确性分析,采用Text-CNN模型建立法条检测模型,首先对目标裁判文书进行分词处理后,利用skip-gram模型训练词向量,然后利用Text-CNN模型进行法条援引准确性检测;所述内容逻辑性分析,采用在语境中的上下文语境搭配关联度T,若该T的值小于设定阈值,则标记为逻辑问题文本。
5.根据权利要求1所述的方法,其特征在于,所述根据指标分析的结果进行指标项得分计算,包括:获取各指标项的打分数据,根据各指标项的计算处理逻辑,对各指标项进行计算处理,得到目标裁判文书的五个指标项的得分。
6.根据权利要求1所述的方法,其特征在于,所述根据各指标项得分计算目标裁判文书的质量的综合评测得分,包括:通过大数据挖掘分析及结合专家经验,建立裁判文书质量评测综合得分计算模型,根据裁判文书质量评测综合得分计算模型,计算目标裁判文书的综合评测得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国司法大数据研究院有限公司,未经中国司法大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163510.0/1.html,转载请声明来源钻瓜专利网。