[发明专利]基于大数据挖掘相似裁判文书的方法和设备有效
申请号: | 201610038106.X | 申请日: | 2016-01-20 |
公开(公告)号: | CN106991092B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 王浩 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06K9/62 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 周建华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 挖掘 相似 裁判 文书 方法 设备 | ||
本申请的目的是一种基于大数据挖掘相似裁判文书的方法与设备,通过获取海量已公开的裁判文书,并获取每一所述裁判文书的案由;基于每一所述裁判文书的文本内容获取关于所述裁判文书案情的文本主题特征信息和关于所述裁判文书中当事人争议内容和当事人诉求内容的若干关键词相关信息,并基于所述文本主题特征信息和若干所述关键词相关信息建立所述裁判文书的文本特征向量;基于若干所述关键词相关信息更新关于关键词的特征词库,有效地将海量的每一裁判文书以文本特征向量的形式精确地显示出来,并更新了关于关键词的特征词库,从而能够快速获取相似的裁判文书,达到了提高挖掘相似的裁判文书的工作效率效率。
技术领域
本申请涉及计算机领域,尤其涉及一种基于大数据挖掘相似裁判文书的技术。
背景技术
随着互联网技术的迅速发展,网络上的文本数据信息呈现爆炸式增长,然而,在这些海量的文本数据信息中查找出少量的有效的文本数据信息就变得越来越困难。例如,在海量的自动问答系统、智能检索系统、邮件筛选系统等存在大量文本数据信息的系统中查找出有效的文本数据信息越来越困难且耗时耗力。
现有技术中,在法院业务场景里,法官对在审案件做出事实认定和判决结果之前,需要事先或者实时挖掘有效的相似的裁判文书。例如,人民法院通过比较多个法官在审判案情相似,当事人诉求相近的不同案件时的判决结果,以审计法官的判决结果是否合理;同时,法官在实际审判案件过程中,也会参考案情相似的已有案例的裁判文书,形成最终的事实认定和裁判文书的判决结果。由于人民法院在搜索有效的相似的裁判文书的实际操作中依赖于大量的人力标注和搜索,耗时又耗力,况且人力搜索出的相似裁判文书的质量完全依赖于个人经验,不能更好的满足法院业务需求,导致工作效率低;又由于各级法院记录裁判文书的风格各异,关键案情和当事人关键诉求通常通过搜索模板或者传统的自然语言处理方法挖掘,容易挖掘出错误的案情和当事人诉求,尤其挖掘不出当事人争议点,造成挖掘出的有效的相似的裁判文书的精确度低;又由于出于对在审输入案例的保密性,不能实时输入在审案例文本查询相似的裁判文书,造成查询相似的裁判文书的实时性差,同时在查询到相似的裁判文书时,由于相似的裁判文书的文字多、内容复杂及裁判文书的判决结果需要人工提取,导致查询到的相似的裁判文书的判决结果的可视化程度低,造成法院处理在审案例文本的业务时的工作效率低。
因此,现有技术中,由于在海量的文本数据中查找某一输入案例文本的相似的裁判文书耗时耗力、实时性差及精确度低,造成正常处理查找业务的工作效率低。
发明内容
本申请的目的是提供一种基于大数据挖掘相似裁判文书的方法与设备,以解决现有技术中在海量的已公开的裁判文书中查找某一输入案例文本的相似的裁判文书耗时耗力、实时性差及精确度低,造成正常处理查找业务的工作效率低的问题。
根据本申请的一个方面,提供了一种用于第一设备端基于大数据挖掘相似裁判文书的方法,包括:
获取海量已公开的裁判文书,并获取每一所述裁判文书的案由;
基于每一所述裁判文书的文本内容获取关于所述裁判文书案情的文本主题特征信息和关于所述裁判文书中当事人争议内容和当事人诉求内容的若干关键词相关信息,并基于所述文本主题特征信息和若干所述关键词相关信息建立所述裁判文书的文本特征向量;
基于若干所述关键词相关信息更新关于关键词的特征词库。
根据本申请的另一个方面,提供了一种用于第二设备端基于大数据挖掘相似裁判文书的方法,包括:
获取输入案例文本,基于检索数据库中关于关键词的特征词库,提取所述输入案例文本的若干候选关键词;
基于所述输入案例文本的文本内容及若干所述候选关键词获取所述输入案例文本的文本主题特征信息和若干关键词相关信息,并基于所述文本主题特征信息和若干所述关键词相关信息建立所述输入案例文本的文本特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610038106.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面选项的处理方法及装置
- 下一篇:一种播单方法及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置