[发明专利]一种法律类案相似度判别及推送方法有效
申请号: | 202010055473.7 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111309900B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 陈欢欢;何慧敏 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279;G06Q50/18 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 法律 相似 判别 推送 方法 | ||
本发明公开了一种法律类案相似度判别与推送方法,相关的判别方法包括:对目标法律案件进行分类,根据得到的案件类别,从历史案件数据库提取相同类别的历史案件构成候选集;对目标法律案件与候选集中的每个同类历史案件,进行事件序列表示;根据事件序列度量模型,计算目标法律案件对应的事件序列与候选集中每个历史案件对应的事件序列的距离;基于事件序列的距离并结合打分函数,计算目标法律案件与候选集中历史案件的相似度。该方法可以实现更加全面、准确的类案识别;同时,通过将法律文书表示为时序事件序列,并基于无监督方式进行相似性计算,选取分值较高的历史案件进行推送,大大减少了人力投入,可更好地实现推送智能化。
技术领域
本发明涉及法律智能领域,尤其涉及一种法律类案相似度判别及推送方法。
背景技术
当前,人工智能理论和技术日益成熟,应用范围不断扩大。2017年,国家人工智能战略《新一代人工智能发展规划》中提出建设智慧法庭,促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用,实现法院审判体系和审判能力智能化。其中,通过人工智能技术实现类案类判已成为贴近法官需求的一项重要研究内容。
类案类判作为一种辅助工具,目的为法官手头正在处理的案件寻找相似甚至相同的案件,以实现启发、拓展法官判案思路、帮助法官正确裁判,使相同或相似案件的判决结果能够有较小偏差。但是现有类案检索系统存在推送案例不精准,无法切实解决法官需要的问题。如推送案例并未做到“同案”,甚至不是“同类”;推送案件数量过高,并未真正节约法官时间,仍需大量人工筛选。
由于法律案件记录多为电子文书,其形式为自然语言表述的文本。由此可将类案识别视作文本相似性度量的一种应用场景。应用现有的自然语言处理方法,可在一定程度上实现类案识别,但尚难以准确辨别案件要素的核心区别点。主要问题如下:
1)基于关键词匹配的方式准确度不够。关键词检索实际上为“抽样验证”,其借助于少量样本得出的结论并不完备。同时,该方法得到的类案数量过多,使得法官难以甄别具有重要参考价值的案件。
2)基于word2vec将词语表示为向量以此构建神经网络的方法需要大量标签化、结构化的训练语料,而当前法律领域缺少海量翔实的标签化法律数据,亦缺少既懂法律又懂技术的人才。
3)类案的主要参考价值在于针对案件中的若干法律细节或难点,推送相似历史案件中法官的判案思路与做法。但是目前未有针对法律行业特点设计的法律文书相似性度量模型。
发明内容
本发明的目的是提供一种法律类案相似度判别及推送方法,解决现有方法需大量手工标注及类案推送不准确、信息冗杂、缺乏法律问题针对性等缺点。
本发明的目的是通过以下技术方案实现的:
一种法律类案相似度判别方法,包括:
对目标法律案件进行分类,根据得到的案件类别,从历史案件数据库提取相同类别的历史案件构成候选集;
对目标法律案件与候选集中的每个同类历史案件,进行事件序列表示;
根据事件序列度量模型,计算目标法律案件对应的事件序列与候选集中每个历史案件对应的事件序列的距离;
基于事件序列的距离并结合打分函数,计算目标法律案件与候选集中历史案件的相似度。
一种法律类案推送方法,包括:利用前述的方法计算目标法律案件与候选集中历史案件的相似度,再按照相似度分值从高到低的顺序对候选集中的历史案件进行排序,提取出排名靠前的M个历史案件进行推送。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010055473.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通道目标通行检测方法、装置以及设备
- 下一篇:一种视联网用户管理方法装置