[发明专利]可解释法律自动判决预测方法及装置有效
申请号: | 202010091848.5 | 申请日: | 2020-02-13 |
公开(公告)号: | CN111325387B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 刘知远;钟皓曦;王聿中;涂存超;张天扬;孙茂松 | 申请(专利权)人: | 清华大学;北京幂律智能科技有限责任公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/18;G06N3/0499;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 马瑞 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可解释 法律 自动 判决 预测 方法 装置 | ||
1.一种可解释法律自动判决预测方法,其特征在于,包括:
编码步骤:获取待处理的法律文书中的事实编码结果;
问题生成步骤:将所述事实编码结果和预设的问题答案集合,输入至全连接神经网络模型,输出问题编号;将所述问题答案集合表示成向量s=(s1,s2,…,sM),长度为M,其中si表示第i个预设问题的状态:若在之前的步骤中已问过,且答案为是,则si=1;若已问过且答案为否,则si=-1;若在之前的步骤中未问过,则si=0;向量s与所述事实编码结果共同组成所述全连接神经网络模型的输入;为了避免重复问相同的问题,利用masked softmax函数来计算选择各个问题的概率,对于第i个问题,如果其尚未被问过,则:选用πi概率最大的问题作为本轮问题;其中,表示问题的分值,i表示预设问题的问题编号;
答案生成步骤:将所述法律文书中的事实部分的分字结果和所述问题编号,输入至BERT-QA模型,输出问题答案;
循环步骤:重复问题生成步骤和答案生成步骤,直到达到预设的重复次数,确定所有问题的答案;
判决步骤:将所有问题的答案,输入至统计机器学习模型,输出判决结果;
其中,所述全连接神经网络模型、所述BERT-QA模型和所述统计机器学习模型,都是基于法律文书样本和预先标记好的法律文书样本的判决结果进行训练后得到的;
所述编码步骤,具体包括:
对所述待处理的法律文书中的事实部分进行分字处理,得到分字结果;
利用BERT模型和字向量对所述分字结果进行编码,得到所述事实编码结果。
2.根据权利要求1所述的可解释法律自动判决预测方法,其特征在于,所述全连接神经网络模型、所述BERT-QA模型和所述统计机器学习模型通过如下步骤进行训练得到:
获取法律文书样本,构建法律文书样本数据集;
提取法律文书样本中的事实信息和判决结果标签;
基于法律文书样本中的事实信息和判决结果标签,借助强化学习算法Deep Q-Learning进行训练,得到所述全连接神经网络模型、所述BERT-QA模型和所述统计机器学习模型。
3.根据权利要求1所述的可解释法律自动判决预测方法,其特征在于,在确定所有问题的答案的过程中,所述问题答案集合中未被选中的问题的答案自动值为否。
4.根据权利要求1所述的可解释法律自动判决预测方法,其特征在于,所述统计机器学习模型为LightGBM模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京幂律智能科技有限责任公司,未经清华大学;北京幂律智能科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010091848.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理