[发明专利]一种基于逆向最优运输模型的可解释司法案例匹配方法及系统在审
申请号: | 202210448566.5 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114818648A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 徐君;俞蔚捷;孙忠祥;董振华;陈旭;许洪腾;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/274;G06F40/30;G06F40/117;G06N3/08 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逆向 最优 运输 模型 可解释 司法 案例 匹配 方法 系统 | ||
本发明实现了一种基于逆向最优运输模型的可解释司法案例匹配方法。方法由三个模块构成:司法要素提取模块针对输入的案例对,以两个案例、案例中每个句子司法要素标签和人工标注的句子对齐标签作为模块输入,输出案例中所有句子的司法要素标签预测;候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素作为输入,以模型预测的候选解释作为输出;匹配模块以司法要素提取模块预测的结果以及所述候选解释生成模块生成的候选解释作为输入,输出案例匹配与否的预测已经与该预测对应的候选解释作为最终解释。该方法实现了预测提供两个方面的解释并提升模型预测的准确率的技术效果。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于逆向最优运输模型的可解释司法案例匹配方法。
背景技术
现有的司法案例匹配模型主要可以分为三类:基于专家知识的模型;基于引用网络的模型;基于文本语义的模型。
基于专家知识的模型是传统的案例匹配方法,该方法高度依赖模型设计者在司法领域的先验知识。例如,[1]提出在事故赔偿领域,一个案例可被拆解成若干要素,诸如支持索赔人、支持应诉人和中立因素等,一个案例可表示成这些要素的集合。于是,案例的匹配可以视为要素之间的匹配。
基于引用网络的模型多应用于英美法系国家,这类模型构建了一个先例引用网络(Precedent Citation Network),其中网络中的节点是法律案例,有向边表示源案例被目标案例引用的情况,即目标案例所使用的源案例的引用。[2]提出使用先例引用集之间的Jaccard相似度指数来推断两个法律案件的相似性。
基于文本语义的模型聚焦案例文本的内容,使用案例之间语义相似性来度量其匹配程度。得益于深度神经网络的蓬勃发展,基于文本语义的模型取得了超越前两类模型的性能表现。例如,[3]提出讲司法案例切分成多个段落,使用大规模预训练语言模型编码每个文本段落,再使用最大池化和循环神经网络建模两个案例中每个段落对的语义相似性,最后使用注意力机制输出案例正例的匹配得分。
现有的基于三元组深度哈希学习的相似司法案例匹配方法是通过获取待匹配的司法案例文书,将待匹配的司法案例文书输入到预训练的特征提取模型中,得到待匹配司法案例文书的特征表示向量,之后将待匹配司法案例文书的特征表示向量,同时输入到预训练的三元组深度哈希学习模型中,得到待匹配司法案例文书的哈希码,最后基于待匹配司法案例文书的哈希码与已知司法案例文书的哈希码,计算司法案例文书的相似度的。
现有的案例匹配模型在匹配精度上取得了较为优异的表现,但是这些模型难以为其匹配预测提供解释。造成这一现象的原因有三:其一,司法案例文档内容复杂,其中仅有部分反映司法要素的句子与匹配结果和匹配解释相关,现有模型并没有在句子层面区分司法要素和噪声;其二,案例中的司法要素可以分成支持匹配、支持不匹配两类,模型最终预测的解释应当权衡这两类司法要素,而现有模型并没有做出区分;其三,司法案例文档篇幅冗长,关于司法要素的标注存在稀疏、有偏等问题,直接拟合法要素的标签学习的模型容易陷入局部最优,限制模型的泛化性。
发明内容
为此,本发明首先提出一种基于逆向最优运输模型的可解释司法案例匹配方法,由三个模块构成:
司法要素提取模块针对输入的案例对,以两个案例(X,Y)、案例中每个句子司法要素标签rX,rY和人工标注的句子对齐标签作为模块输入,采用逆向最优运输过程,模型根据学习案例句子之间的“运输代价”,输出案例中所有句子的司法要素标签预测其中分别表示案例X和Y中匹配的司法要素和不匹配的司法要素,
候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素作为输入,以模型预测的候选解释作为输出,其中i表示候选解释的数量,候选解释生成模块输出分别作为标签0的解释和标签1的解释;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210448566.5/2.html,转载请声明来源钻瓜专利网。