[发明专利]法律法规解析方法、装置、计算机设备及可读存储介质在审
申请号: | 202210818710.X | 申请日: | 2022-07-13 |
公开(公告)号: | CN115374239A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 马旭慧;张凯;陈铭;柳进军;李浩浩;武帅兴;张海军;刑凯翔;李俊鹏;陈楠 | 申请(专利权)人: | 北京中海住梦科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/338 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 陈超 |
地址: | 100081 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律法规 解析 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种法律法规解析方法,其特征在于,包括:对加载的原始法律法规文档进行预解析得到预解析数据,所述预解析数据包括:目录信息项和各所述目录信息项对应的最大索引序号;
所述目录信息项包括:“卷”目录、“编”目录、“章”目录和“条”内容,所述“条”内容包括:“条”目录和“款”段落;
所述“卷”目录、“编”目录、“章”目录和“条”目录均位于所述原始法律法规文档每行的第一个空格之前,所述“款”段落为所述“条”目录下,无数字排序的自然段;
根据所述预解析数据生成法律法规模板;
逐行解析所述原始法律法规文档并与所述法律法规模板比对,将解析得到的各条款内容挂载到所述法律法规模板中对应的各目录信息项下,形成法律法规模型;
验证所述法律法规模型。
2.根据权利要求1所述的法律法规解析方法,其特征在于,所述目录信息项还包括:“节”目录,所述“节”目录位于所述原始法律法规文档每行的第一个空格之前。
3.根据权利要求1或2所述的法律法规解析方法,其特征在于,以所述最大索引序号的序号数为各所述目录信息项的项数生成法律法规模板。
4.根据权利要求3所述的法律法规解析方法,其特征在于,所述原始法律法规文档的格式包括:word文档、文本文档、PDF文档或网页文档。
5.根据权利要求1所述的法律法规解析方法,其特征在于,形成所述法律法规模型的方法具体包括:
按照所述原始法律法规文档的结构逐行解析所述原始法律法规文档的内容,逐行读取原始法律法规文档的目录信息项及其索引序号并与所述法律法规模板中的目录信息项及其索引序号比对,找到所述原始法律法规文档中每行的内容对应在所述法律法规模板中的具体位置并挂载。
6.根据权利要求1或2所述的法律法规解析方法,其特征在于,所述法律法规模型的形成方法还包括:逐行对“项”目录、“目”目录的解析和挂载;
所述“项”基于“条”目录或“款”段落下,非所述目录信息项,以“项”的应用格式开始的行,解析为“项”;
所述“目”基于“项”目录下,非所述目录信息项,以“目”的应用格式开始的行,解析为“目”。
7.根据权利要求1或6所述的法律法规解析方法,其特征在于,所述法律法规模型的验证的内容包括:
对全篇法律法规的所述目录信息项的索引序号连续性的验证;和/或
对每个“款”段落下“项”目录的索引序号连续性的验证;和/或
对每个“项”目录下“目”目录的索引序号连续性的验证;
对解析得到的各条款的内容正确性的验证。
8.根据权利要求1或7所述的法律法规解析方法,其特征在于,所述在全篇法律法规下对所述目录信息项的索引序号连续性的验证内容包括:
“条”目录的索引序号在每个“章”和/或“节”目录下连续性的验证;
“条”目录的索引序号在所述全篇法律法规下连续性的验证;
还可以包括:
“项”目录的索引序号在所述全篇法律法规下连续性的验证。
9.根据权利要求1或8所述的法律法规解析方法,其特征在于,所述法律法规模型的验证还包括二次验证,所述二次验证用于通过对所述原始法律法规文档再次进行解析,与生成的所述法律法规模型比对,标记验证不通过的条款。
10.根据权利要求1所述的法律法规解析方法,其特征在于,还包括:利用ASCII码对加载的所述原始法律法规文档进行清洗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中海住梦科技有限公司,未经北京中海住梦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210818710.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种从含有机铑液体中提取铑的方法
- 下一篇:一种汽车行李箱盖板面料复合方法