[发明专利]一种裁判文书中的金额解析方法及装置有效
申请号: | 201510867476.X | 申请日: | 2015-12-01 |
公开(公告)号: | CN106815203B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 胡斌;崔维福 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 裁判 文书 中的 金额 解析 方法 装置 | ||
1.一种裁判文书中的金额解析方法,其特征在于,包括:
对裁判文书进行分段获取原告的诉请段落和法院的判决段落;
对所述诉请段落和判决段落进行分句;
按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额;
所述按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取,包括:
按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额;
将各个分句中整理得到的预设标准形式的金额进行去重处理,提取去重后的金额;其中,所述去重处理是将各分句中整理得到的金额保留加总值的结果,并将加总之前的单个金额清零;
所述按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额,包括:
对所述各个分句中涉及的比例关系的金额整理为按比例分配后预设标准形式的金额;对所述各个分句中涉及抵扣关系中扣除的金额整理为预设标准形式的金额的负值;将所述各个分句中涉及中文大小写的金额整理为预设标准形式的金额;
所述将所述各个分句中涉及中文大小写的金额整理为预设标准形式的金额,包括:
对各个分句进行分词处理,得到多个词语;
将所述多个词语中涉及中文大小写金额的词语组合为金额字符串;
查询金额字符串中是否包含连续多个金额单位词,若是,则按照连续多个金额单位词中的最后一个单位词将所述金额字符串切分为多个金额切分词;
按照所述连续金额单位词从左到右的顺序,依次计算每一个金额单位词对应的阿拉伯数值,直到计算出最后一个金额单位词所对应的阿拉伯数值,并将每一个金额单位词对应的阿拉伯数值作为每个金额切分词对应的阿拉伯数值。
2.根据权利要求1所述的方法,其特征在于,所述对裁判文书进行分段获取原告的诉请段落和法院的判决段落,包括:
以标识一为首、标识二为尾截取原告的诉请段落,所述标识一为原告诉请或者原告诉请的变体,所述标识二为换行符号;
以标识三为首、标识四为尾截取法院的判决段落,所述标识三为判决如下或者判决如下的变体,所述标识四为本案或者本案的变体。
3.根据权利要求1所述的方法,其特征在于,所述对所述诉请段落和判决段落进行分句,包括:
依次以换行符、句号或分号对所述诉请段落和判决段落进行分句。
4.根据权利要求1所述的方法,其特征在于,所述将所述多个词语中涉及中文大小写金额的词语组合为金额字符串之后,所述方法还包括:
查询金额字符串中是否包含连续多个金额单位词,若否,则按照金额单位词将所述金额字符串切分为多个金额切分词;
根据每一个金额切分词的金额数值和金额单位计算出每一个金额切分词对应的阿拉伯数值;
对所述每一个金额切分词对应的阿拉伯数值求和,得到所述各个分句中涉及的金额。
5.根据权利要求1至4中任一项所述的方法,其特征在于,还包括:
遍历一组文书中的每个裁判文书,分别将每个裁判文书中原告的诉请金额和法院的支持金额加总,得到总原告诉请金额和总法院支持金额;
将所述总法院支持金额除以所述总原告诉请金额,得到法院支持比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510867476.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:标题校验方法及系统
- 下一篇:裁判文书的分段方法及装置