[发明专利]法律裁判文书的解析方法及装置在审
申请号: | 201510869235.9 | 申请日: | 2015-12-01 |
公开(公告)号: | CN106815206A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 李轶;崔维福 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/21;G06F17/30;G06Q50/18 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律 裁判 文书 解析 方法 装置 | ||
1.一种法律裁判文书的解析方法,其特征在于,包括:
获取待解析法律裁判文书的文本,其中,所述待解析法律裁判文书的文本包括多个自然段落;
将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;
将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及
分别对所述至少一个段落集合的文本内容进行解析。
2.根据权利要求1所述的方法,其特征在于,将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合包括:
将所述多个预设匹配规则集合中的每个预设匹配规则集合依次与所述每个自然段落执行匹配处理;以及
将所述每个自然段落划分至第一个匹配出的预设匹配规则集合所对应的段落集合。
3.根据权利要求2所述的方法,其特征在于,将所述多个预设匹配规则集合中的每个预设匹配规则集合依次与所述每个自然段落执行匹配处理包括:
依次获取所述自然段落与所述多个预设匹配规则集合的匹配度;以及
将第一个获取到的匹配度达到预设匹配度阈值的预设匹配规则集合,作为所述自然段落第一个匹配出的预设匹配规则集合。
4.根据权利要求3所述的方法,其特征在于,依次获取所述自然段落与所述多个预设匹配规则集合的匹配度包括:
依次确定每个预设匹配规则集合中包括的与所述自然段落相匹配的预设匹配规则;以及
根据与所述自然段落相匹配的预设匹配规则的优先级获取所述自然段落与所述每个预设匹配规则集合的匹配度。
5.根据权利要求4所述的方法,其特征在于,所述多个预设匹配规则集合包括第一预设匹配规则集合,
依次确定每个预设匹配规则集合中包括的与所述自然段落相匹配的预设匹配规则包括:
按照预设匹配规则的优先级由大到小的次序,依次检测所述第一预设匹配规则集合中的预设匹配规则是否与所述自然段落相匹配,其中,每检测到所述第一预设匹配规则集合中的一个预设匹配规则与所述自然段落相匹配,则记录该预设匹配规则的优先级,
根据与所述自然段落相匹配的预设匹配规则的优先级获取所述自然段落与所述每个预设匹配规则集合的匹配度包括:
依次获取所述第一预设匹配规则集合中与所述自然段落相匹配的预设匹配规则的优先级,并计算已经获取到的优先级的平均值,直到所述优先级的平均值达到所述预设匹配度阈值,或者直到获取到所述第一预设匹配规则集合中与所述自然段落相匹配的最后一个预设匹配规则的优先级;以及根据所述已经获取到的优先级的平均值计算所述自然段落与所述第一预设匹配规则集合的匹配度。
6.根据权利要求2所述的方法,其特征在于,在一个自然段落匹配出对应的预设匹配规则集合之后,将所述多个预设匹配规则集合中的每个预设匹配规则集合依次与所述每个自然段落执行匹配处理包括:
对于所述一个自然段落的下一个自然段落,将所述一个自然段落所对应的所述预设匹配规则集合与所述下一个自然段落执行匹配处理,并检测是否匹配成功;
如果检测出未匹配成功,则将所述下一个自然段落与所述多个预设匹配规则集合中的其他预设匹配规则集合依次执行匹配处理,直到匹配到一个预设匹配规则集合或者直到与所述其他预设匹配规则集合均执行了匹配但都未匹配成功。
7.根据权利要求1所述的方法,其特征在于,在获取待解析法律裁判文书的文本包括的多个自然段落之前,所述方法还包括:
检测所述待解析法律裁判文书的文本中是否包括预设标识,其中,所述预设标识为所述解析法律裁判文书的文本中与所述文本内容无关的标识;以及
如果检测出所述待解析法律裁判文书的文本中包括所述预设标识,则清除所述预设标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510869235.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:裁判文书的分段方法及装置
- 下一篇:用于法律裁判文书的信息处理方法及装置