[发明专利]法律裁判文书的解析方法及装置在审
申请号: | 201510869235.9 | 申请日: | 2015-12-01 |
公开(公告)号: | CN106815206A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 李轶;崔维福 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/21;G06F17/30;G06Q50/18 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律 裁判 文书 解析 方法 装置 | ||
技术领域
本申请涉及法律裁判文书处理领域,具体而言,涉及一种法律裁判文书的解析方法及装置。
背景技术
通常,对于法律裁判文书,往往需要去解析裁判文书的类型、每个段落以及提取每个段落的维度信息等参数。对人民法院下发的裁判文书进行解析,可以帮助用户获取更多有效的法律参考信息。但是,目前,对法律裁判文书的解析仍然采用人工解析的方式来实现。一般是由人工去区分文书的不同类型、文书的各个段落以及提取每段文书的维度信息。由于人民法院下发的法律裁判文书类型丰富,包含的信息量也比较大,信息维度也比较多(例如,原告、被告、上诉人、被上诉人、证据、判决结果和费用等),因此,依靠人工去区分不同文书的各个段落以及提取每段文书的维度信息,工作量非常大。
借助法律裁判文书检索系统,可对法律裁判文书进行简单地搜索归纳。但是,由于当前的法律裁判文书检索系统通常只是对法律裁判文书的全文内容进行解析,因此,导致检索结果参差不齐,一般仅对包含某些固定关键词的相关内容进行罗列,或者只进行简单地信息分类。可见,通过当前的法律文书检索系统获取的法律裁判文书的解析结果的准确性较差。
针对相关技术中法律裁判文书的解析准确性较差的技术问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种法律裁判文书的解析方法及装置,以至少解决相关技术中法律裁判文书的解析准确性较差的技术问题。
根据本申请实施例的一个方面,提供了一种法律裁判文书的解析方法,该方法包括:获取待解析法律裁判文书的文本,其中,待解析法律裁判文书的文本包括多个自 然段落;将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及分别对至少一个段落集合的文本内容进行解析。
进一步地,将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合包括:将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理;以及将每个自然段落划分至第一个匹配出的预设匹配规则集合所对应的段落集合。
进一步地,将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理包括:依次获取自然段落与多个预设匹配规则集合的匹配度;以及将第一个获取到的匹配度达到预设匹配度阈值的预设匹配规则集合,作为该自然段落第一个匹配出的预设匹配规则集合。
进一步地,依次获取自然段落与多个预设匹配规则集合的匹配度包括:依次确定每个预设匹配规则集合中包括的与自然段落相匹配的预设匹配规则;以及根据与该自然段落相匹配的预设匹配规则的优先级获取该自然段落与每个预设匹配规则集合的匹配度。
进一步地,多个预设匹配规则集合包括第一预设匹配规则集合,依次确定每个预设匹配规则集合中包括的与自然段落相匹配的预设匹配规则包括:按照预设匹配规则的优先级由大到小的次序,依次检测第一预设匹配规则集合中的预设匹配规则是否与自然段落相匹配,其中,每检测到第一预设匹配规则集合中的一个预设匹配规则与该自然段落相匹配,则记录该预设匹配规则的优先级,根据与自然段落相匹配的预设匹配规则的优先级获取该自然段落与每个预设匹配规则集合的匹配度包括:依次获取第一预设匹配规则集合中与该自然段落相匹配的预设匹配规则的优先级,并计算已经获取到的优先级的平均值,直到优先级的平均值达到预设匹配度阈值,或者直到获取到第一预设匹配规则集合中与该自然段落相匹配的最后一个预设匹配规则的优先级;以及根据已经获取到的优先级的平均值计算该自然段落与第一预设匹配规则集合的匹配度。
进一步地,在一个自然段落匹配出对应的预设匹配规则集合之后,将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理包括:对于一个自然段落的下一个自然段落,将该一个自然段落所对应的预设匹配规则集合与下一个自然段落执行匹配处理,并检测是否匹配成功;如果检测出未匹配成功,则将下一个自然段落与多个预设匹配规则集合中的其他预设匹配规则集合依次执行匹配处理, 直到匹配到一个预设匹配规则集合或者直到与其他预设匹配规则集合均执行了匹配但都未匹配成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510869235.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:裁判文书的分段方法及装置
- 下一篇:用于法律裁判文书的信息处理方法及装置