[发明专利]一种案件检索方法及系统有效
申请号: | 201910884088.0 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110717041B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 万玉晴;聂耀鑫;衣永刚 | 申请(专利权)人: | 太极计算机股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/335 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 田磊 |
地址: | 100102 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 案件 检索 方法 系统 | ||
本发明公开了一种案件检索方法及系统,该方法包括:提取案件数据库中的案件要素信息与表述文本,对司法争议焦点描述文本进行聚类处理,形成争议焦点及要素标签库;基于争议焦点及要素标签库,对案件数据库中的案件卷宗材料进行数据对应标注,形成案件卷宗争议焦点库;根据所述争议焦点及要素标签库、案件卷宗争议焦点库,构建并训练案件语言检索模型;对欲检索的案件材料,通过基于案件争议焦点的话题矛盾检测方法,确定案件卷宗材料中的矛盾点,并根据矛盾点提炼成该案件材料相匹配的争议焦点;利用所述案件语言检索模型,根据提炼出的争议焦点对欲检索的案件材料提供数据检索服务。本发明能够从案件争议焦点角度进行相似案件的检索推送。
技术领域
本发明涉及数据检索技术领域,具体来说,涉及一种案件检索方法及系统。
背景技术
随着社会信息的公开化、透明化,案件的审判结果也越来越受到社会的关注。对于同一个案件,不同的法官的裁量尺度的差别也往往不一样。如果能够在判决案件之前,及时的推荐以往的相似案件,无疑会起到一个很好的参考作用。
而在上述背景下,各级法院目前已经逐步上线了类案推荐系统,然而,现有的司类案推荐系统普遍采用的是基于向量空间模型相似度计算方法,通过检索关键词进行检索推送的。而这就使得司法人员在使用时,往往检索不到自己想要查询的审判要素点,或需要花费大量时间从推送的大量案件中逐个阅读查找,这不仅费事费力,而且效率低下。
针对上述相关技术中存在的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种案件检索方法及系统,能够从案件争议焦点角度进行相似案件的检索推送。
本发明的技术方案是这样实现的:
根据本发明的一方面,提供了一种案件检索方法。
该案件检索方法包括以下步骤:
提取案件数据库中的案件要素信息与表述文本,对表述文本中的司法争议焦点描述文本进行聚类处理,并对得到的聚类类别进行标注与校验,形成争议焦点及要素标签库;
基于争议焦点及要素标签库,对案件数据库中的案件卷宗材料进行数据对应标注,形成具有争议焦点标签与案件要素标签的案件卷宗争议焦点库;
根据所述争议焦点及要素标签库、案件卷宗争议焦点库,利用机器学习技术,构建并训练案件语言检索模型;
对欲检索的案件材料,通过基于案件争议焦点的话题矛盾检测方法,确定案件卷宗材料中的矛盾点,并根据矛盾点提炼成该案件材料相匹配的可能的争议焦点;
利用所述案件语言检索模型,根据提炼出的争议焦点对欲检索的案件材料提供数据检索服务。
此外,在提取案件数据库中的案件要素信息与表述文本,对表述文本中的司法争议焦点描述文本进行聚类处理时,采用面向争议焦点的层次化主题聚类方法进行聚类处理。
另外,采用面向争议焦点的层次化主题聚类方法进行聚类处理包括以下步骤:从案件数据库中提取案件要素信息与表述文本的原始数据;采用GSOM算法对所述原始数据进行聚类,得到聚类类别;将每个聚类类别划分为多个子类,并从每个子类中选择抽样数据作为该子类的类别代表,并进行密度聚类。
此外,所述GSOM算法的神经元权值调整函数公式为:
mi(t+1)=mi(t)+hc(x),i(t)[x(t)-mi(t)];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太极计算机股份有限公司,未经太极计算机股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910884088.0/2.html,转载请声明来源钻瓜专利网。