[发明专利]一种基于逆向最优运输模型的可解释司法案例匹配方法及系统在审
申请号: | 202210448566.5 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114818648A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 徐君;俞蔚捷;孙忠祥;董振华;陈旭;许洪腾;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/274;G06F40/30;G06F40/117;G06N3/08 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逆向 最优 运输 模型 可解释 司法 案例 匹配 方法 系统 | ||
1.一种基于逆向最优运输模型的可解释司法案例匹配方法,其特征在于:由三个模块构成:
司法要素提取模块针对输入的案例对,以两个案例(X,Y)、案例中每个句子司法要素标签rX,rY和人工标注的句子对齐标签作为模块输入,采用逆向最优运输过程,模型根据学习案例句子之间的“运输代价”,输出案例中所有句子的司法要素标签预测其中分别表示案例X和Y中匹配的司法要素和不匹配的司法要素,
候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素作为输入,以模型预测的候选解释作为输出,其中i表示候选解释的数量,候选解释生成模块输出分别作为标签0的解释和标签1的解释;
匹配模块以所述司法要素提取模块预测的以及所述候选解释生成模块生成的候选解释作为输入,将视为查询,候选解释作为文档,分别计算与匹配得分,输出得分较高的解释以及该解释对应的匹配标签,若的得分较高,模型输出结果为两个案例匹配,以及作为案例匹配理由的候选解释若的得分较高,模型输出结果为两个案例不匹配,以及作为案例不匹配理由的候选理由即为输出案例匹配与否的预测以及与该预测对应的候选解释作为最终解释。
2.如权利要求1所述的一种基于逆向最优运输模型的可解释司法案例匹配方法,其特征在于:所述最优运输过程首先对于司法案例匹配的场景中,对于任意两个案例μ、ν分别视为一个均匀分布,即其中1D表示D维全1的向量,两个案例之间的最优运输方案为:
其中表示任意联合分布,其中的句子满足边缘分布为μ和ν;为代价矩阵,c(xm,yn)表示两个句子之间的差异;
之后,采用逆向最优运输试图从中学习鲁棒性更强的代价矩阵C:给定最优运输方案,即人工标注,求解代价矩阵,即案例中句子的差异情况:
s.t.A*(C)=argminAEn(μ,v)<A,C>+γ<A,logA>其中KL表示句子对齐标签和运输方案A*之间的KL散度,最终建模C为两个子矩阵的线性组合:
C=Cs+∈Cr
其中Cs是两个案例句子级别的语义相似度矩阵,使用神经网络计算句子向量相似度;Cr是两个案例句子级别的要素相似度矩阵,使用神经网络对案例中的句子进行分类,区分司法要素和非司法要素,再比较两个句子是否属于同类司法要素;∈是平衡系数;
在训练过程中,司法要素提取模块学习代价矩阵C中的参数;在测试过程,司法要素提取模块根据C进行正向最优运输,根据最优运输方案确定案例中句子的对齐情况,并提取司法要素标签预测
3.如权利要求2所述的一种基于逆向最优运输模型的可解释司法案例匹配方法,其特征在于:所述司法要素提取模块,作为最小化模型预测的和人工标注的句子级别对齐程度之间的损失以及在构建Cr时模型对每个句子司法要素分类预测和人工标注之间的损失的损失函数可以写成:
其中,是模型在构建代价矩阵C时预测案例中每个句子司法要素标签与真实标签之间的交叉熵损失:
其中δ(r,k)=1如果r=k否则为0;是模型逆向最优运输损失,优化代价矩阵C和对应的最优运输方案矩阵:
4.如权利要求3所述的一种基于逆向最优运输模型的可解释司法案例匹配方法,其特征在于:所述候选解释生成模块最小化模型生成的和人工标注的自然语言解释之间的差异,损失函数是微调预训练语言模型的损失:
5.如权利要求4所述的一种基于逆向最优运输模型的可解释司法案例匹配方法,其特征在于:所述匹配模块最小化模型预测的和人工标注的案例匹配标签之间的差异损失函数可以写成:
其中是模型对于案例匹配关系的预测与真实标签之间的交叉熵损失:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210448566.5/1.html,转载请声明来源钻瓜专利网。