[发明专利]裁判文书的分段方法及装置在审
申请号: | 201510867898.7 | 申请日: | 2015-12-01 |
公开(公告)号: | CN106815204A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 胡斌;杜宁 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 裁判 文书 分段 方法 装置 | ||
1.一种裁判文书的分段方法,其特征在于,包括:
对目标裁判文书进行分行处理,得到文书行集合,其中,所述文书行集合为对所述目标裁判文书进行分行处理后得到的多个文书行组成的集合;
根据预设正则规则集合分别对所述文书行集合中的每个文书行添加对应的段落标识,其中,所述预设正则规则集合为根据多篇裁判文书统计出的规则组成的集合;以及
基于所述文书行集合中的每个文书行对应的段落标识对所述目标裁判文书进行分段处理。
2.根据权利要求1所述的方法,其特征在于,根据预设正则规则集合分别对所述文书行集合中的每个文书行添加对应的段落标识包括:
将预设正则规则集合中的多个正则规则条件逐次与所述文书行集合中的每个文书行的内容进行匹配;
获取所述文书行集合中与所述多个正则规则条件匹配上的文书行;以及
对与所述多个正则规则条件匹配上的文书行添加对应的段落标识。
3.根据权利要求1所述的方法,其特征在于,根据预设正则规则集合分别对所述文书行集合中的每个文书行添加对应的段落标识包括:
将预设正则规则集合中的多个正则规则条件逐次与所述文书行集合中的每个文书行的内容进行匹配;
获取所述文书行集合中未与所述多个正则规则条件匹配上的文书行,得到至少一个未标识文书行;
在所述文书行集合中确定所述至少一个未标识文书行的上一个文书行对应的段落标识;以及
将所述至少一个未标识文书行的上一个文书行对应的段落标识作为所述至少一个未标识文书行的段落标识。
4.根据权利要求2或3所述的方法,其特征在于,所述多个正则规则条件包括第一正则规则条件和第二正则规则条件,其中,所述第一正则规则条件当前与所述文书行集合进行匹配的条件,所述第二正则规则条件为所述第一正则规则条件与所述文书行集合匹配失败的情况下,所述多个正则规则条件中下一个与所述文书行集合进行匹配的条件,将预设正则规则集合中的多个正则规则条件逐次与所述文书行集合中的每个文书行的内容进行匹配包括:
将所述多个正则规则条件中的第一正则规则条件与所述文书行集合中的每个文书行的内容进行匹配;
判断所述多个正则规则条件中的第一正则规则条件与所述文书行集合中的每个文书行的内容是否匹配结束;
如果所述多个正则规则条件中的第一正则规则条件与所述文书行集合中的每个文书行的内容已匹配结束,将所述多个正则规则条件中的第二正则规则条件作为当前与所述文书行集合中的每个文书行的内容进行匹配的条件;以及
将所述多个正则规则条件中的第二正则规则条件与所述文书行集合中的每个文书行的内容进行匹配。
5.根据权利要求1所述的方法,其特征在于,对目标裁判文书进行分行处理,得到文书行集合包括:
确定所述目标裁判文书的格式类型;
确定所述目标裁判文书的格式类型对应的换行符;以及
根据所述目标裁判文书的格式类型对应的换行符进行分行处理,得到所述文书行集合。
6.根据权利要求1所述的方法,其特征在于,基于所述文书行集合中的每个文书行对应的段落标识对所述目标裁判文书进行分段处理包括:
确定所述文书行集合中的每个文书行对应的段落标识中的每个段落标识;
基于每个段落标识对所述目标裁判文书中的文书行进行段落划分;以及
将具有相同的段落标识的多个文书行合并为同一个段落。
7.一种裁判文书的分段装置,其特征在于,包括:
第一处理单元,用于对目标裁判文书进行分行处理,得到文书行集合,其中,所述文书行集合为对所述目标裁判文书进行分行处理后得到的多个文书行组成的集合;
添加单元,用于根据预设正则规则集合分别对所述文书行集合中的每个文书行添加对应的段落标识,其中,所述预设正则规则集合为根据多篇裁判文书统计出的规则组成的集合;以及
第二处理单元,用于基于所述文书行集合中的每个文书行对应的段落标识对所述目标裁判文书进行分段处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510867898.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种裁判文书中的金额解析方法及装置
- 下一篇:裁判文书的分段方法及装置