[发明专利]一种罪名预测方法及系统在审

专利信息
申请号: 201910695855.3 申请日: 2019-07-30
公开(公告)号: CN112396201A 公开(公告)日: 2021-02-23
发明(设计)人: 戴威 申请(专利权)人: 北京国双科技有限公司
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/18;G06F16/35;G06F40/205
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 古利兰
地址: 100083 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 罪名 预测 方法 系统
【说明书】:

发明提供一种罪名预测方法及系统,该方法为:获取需要预测罪名的第一司法文书。对第一司法文书进行截取或补充处理,得到第二司法文书。将第二司法文书输入预先建立的罪名预测模型进行罪名预测,得到第一司法文书对应的罪名预测结果,其中,罪名预测模型由基于样本数据训练语言模型获得。在本方案中,通过海量的司法文书预先训练语言模型得到罪名预测模型,将需要预测罪名的司法文书进行截取或补充处理,过滤该司法文书中冗余的证人证言部分。将进行截取或补充处理后的司法文书作为罪名预测模型的输入,得到该司法文书的罪名预测结果,从而节约人力成本和时间成本,提高判决的准确性和效率。

技术领域

本发明涉及自然语言处理技术领域,具体涉及一种罪名预测方法及系统。

背景技术

随着现代社会的发展,法律是文明社会发展过程中的产物之一。法律通常是指由社会认可国家确认立法机关制定规范的行为准则,并由国家强制力保证规定当事人权利和义务为内容的,对全体社会成员具有普遍约束力的一种特殊行为规范。当社会成员之间出现纠纷时,由司法机关按照法律进行立案裁定。

目前对在进行法律判决时,通常由人工根据案情的描述并查阅相关法律,根据法律规定做出判决。但是由于各国法律规定的罪名数量较多,通过人工逐一梳理案情然后再进行判决需要较高的时间和人力成本。另一方面由于语言的多样性,在梳理案情时,对同一个定罪要素通常有多个不同的描述和表达方式,会影响判决的准确性和效率。

发明内容

有鉴于此,本发明实施例提供一种罪名预测方法及系统,以解决现有人工进行罪名判决存在的人力成本高、时间成本高、准确性低和效率低等问题。

为实现上述目的,本发明实施例提供如下技术方案:

本发明实施例第一方面公开一种罪名预测方法,所述方法包括:

获取需要预测罪名的第一司法文书;

对所述第一司法文书进行截取或补充处理,得到第二司法文书;

将所述第二司法文书输入预先建立的罪名预测模型进行罪名预测,得到所述第一司法文书对应的罪名预测结果,其中,所述罪名预测模型由基于样本数据训练语言模型模型获得,所述语言模型用于根据预设数量的法律文本进行预训练确定所述要素解析模型的初始化模型参数。

优选的,当所述语言模型为BERT模型,所述由基于样本数据训练语言模型获得罪名预测模型的过程,包括:

对所述样本数据进行文字替换以及句子拼接处理得到第一训练数据,其中,所述样本数据由对公开的司法文书进行截取处理获得;

将所述第一训练数据作为第一BERT模型的输入,结合预设的第一损失函数和所述样本数据,训练所述第一BERT模型直至所述第一BERT模型收敛;

将收敛后的所述第一BERT模型的模型参数作为第二BERT模型的初始化模型参数;

将所述样本数据作为所述第二BERT模型的输入,结合预设的第二损失函数和所述样本数据对应的罪名标签,训练所述第二BERT模型直至所述第二BERT模型收敛,得到所述罪名预测模型,其中,所述罪名标签由所述公开的司法文书对应的判决段中获得。

优选的,所述将所述第一训练数据作为第一BERT模型的输入,结合预设的第一损失函数和所述样本数据训练所述第一BERT模型直至所述第一BERT模型收敛,包括:

将所述第一训练数据作为所述第一BERT模型的输入,得到对应文字替换位置的文字预测结果,以及得到对应句子拼接位置的句子预测结果;

使用第一子损失函数计算所述文字替换位置的实际文字和所述文字预测结果之间的文字误差,以及使用第二子损失函数计算所述句子拼接位置的实际句子与所述句子预测结果之间的句子误差;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910695855.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top