[发明专利]一种司法判决书案情信息结构化处理系统有效
申请号: | 201810989323.6 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109344187B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 吴共庆;汪瀛寰;薛婵;马凤君;何颖;李培培;胡学钢;吴信东 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/332;G06Q50/18 |
代理公司: | 安徽合肥华信知识产权代理有限公司 34112 | 代理人: | 余成俊 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 司法 判决书 案情 信息 结构 处理 系统 | ||
本发明公开了一种司法判决书案情信息结构化处理系统,适用于信息抽取和自然语言处理领域;系统包括以下模块:司法判决书案情信息结构化表示模块、建立司法判决书案情信息序列标注模型模块、属性触发词管理模块和生成结构化司法判决书案情信息模块。根据用户给定的案件类型,建立司法判决书案情信息结构化数据表示框架,构建司法判决书案情信息序列标注训练集并训练序列标注模型,结合属性触发词集合,根据生成结构化司法判决书案情信息方法生成结构化的司法判决书案情信息。本发明根据用户提供的司法判决书案件类型和案情信息,实现司法判决书案情信息的结构化处理,其目的在于提供一种从无结构化司法判决书文本中抽取结构化信息的有效方式。
技术领域
本发明涉及到信息抽取和自然语言处理领域,具体是一种司法判决书案情信息结构化处理系统。
背景技术
在司法公开的背景下,生效的司法判决书在互联网上公布,产生了大量真实有效的司法判决书数据。加强对司法判决书数据的研究应用是信息化建设的需要,是推进人民法院审判体系和审判能力现代化的需要,也是加速推进“智慧法院”建设和“智能检察院”建设的必然要求。目前,针对司法判决书数据的应用主要使用两类技术,分别是和基于规则的司法判决书信息抽取技术和基于搜索引擎的类案检索技术。
不同法院的司法判决书的内容组织形式基本相同,大多包括判决书基本信息、法律角色信息、起诉书信息、案情信息和判决信息五部分内容,并且各部分内容包含相对规范的线索词。基于规则的司法判决书信息抽取技术首先利用线索词构建规则表达式对司法判决书进行拆分,然后再根据各部分内容的不同陈述方式,分别构造不同的抽取规则进行语义信息的抽取。这类技术对司法判决书中的判决书基本信息和法律角色信息等部分的抽取准确率较高,但也存在不足之处:(1)规则需要由那些同时具备法律背景及计算机语言学背景的专家制作,导致规则的制定成本高。(2)不同类型的司法判决书有不同的表述方式,导致规则的类型多种多样,制定这些规则需要耗费大量的人力物力。(3)对于司法判决书中的案情信息和判决信息等部分,由于这些部分存在陈述方式的多样性和复杂性,因此仅依据规则难以准确抽取语义信息。
基于搜索引擎技术的类案检索技术,为用户提供相关司法判决书的检索功能,即根据用户输入的关键词,返回所有与关键词相关的司法判决书集合。但这类技术存在以下三点不足:(1)关键词涉及到与法律相关的专业词汇,如当事人、法官观点等,需要用户有相关的法律业务背景知识。(2)系统返回的是所有包含关键词的司法判决书,信息量大且不具有针对性。(3)返回的结果以完整的司法判决书形式呈现,需要用户花费大量时间阅读判决书以获取所需信息。
总之,现有的司法判决书数据的相关应用均集中在对司法判决书的简单检索,以及对司法判决书中部分数据的精确抽取工作上,未能充分考虑到司法判决书的内容冗长且陈述方式多样性的数据特点,不具备对案情信息等部分内容的精确抽取能力,因此难以满足面向司法判决书数据的后续分析需求。若能对司法判决书中的案情信息进行结构化处理,即从司法判决书案情信息中抽取有用信息,并以属性,值对的形式呈现出来,则能方便用户的查阅和后续的分析处理工作。
发明内容
本发明的目的是提供一种司法判决书案情信息结构化处理系统,依托事件抽取、序列标注和属性,值对抽取技术,可以从无结构且冗长的司法判决书案情信息中抽取案件的属性,值对信息,并以树状结构化数据表示框架向用户展示,解决了基于规则的司法判决书案情信息抽取技术在制定规则时的高成本问题,以及基于搜索引擎的类案检索技术对法律业务背景知识的要求高、检索结果的信息覆盖率低、难以满足面向司法判决书案情信息的后续分析需求的问题。
为了达到上述目的,本发明所采用的技术方案为:
一种司法判决书案情信息结构化处理系统,其特征在于,包括:
司法判决书案情信息结构化表示模块:给定案件类型,建立所述案件类型的司法判决书案情信息结构化数据表示框架;所述司法判决书案情信息结构化数据表示框架是树状数据表示框架,树的叶节点存储属性信息,树的内部节点存储属性的类别;所述属性信息包括属性名、属性值类型和属性,值对集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810989323.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置