[发明专利]一种基于法理图规则引擎的法律概念识别方法在审
申请号: | 201910714738.7 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110414007A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 倪有发;杜向阳 | 申请(专利权)人: | 南京擎盾信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N5/04 |
代理公司: | 苏州拓云知识产权代理事务所(普通合伙) 32344 | 代理人: | 潘好帅 |
地址: | 210000 江苏省南京市雨花台*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律概念 规则引擎 逻辑关系 规则树 逻辑正确性 广度优先 规则生成 专家知识 解释性 逻辑图 法律 遍历 构建 结点 算法 推理 直观 | ||
本发明公开了一种基于法理图规则引擎的法律概念识别方法,本发明将代表法律专家知识的法律图和规则引擎结合起来,实现了逻辑关系推理的法律概念识别;本发明构建一个法律概念法理逻辑图,每个法律概念可以看成是法理图上的一个结点,法理图确定了法律概念间的逻辑关系,使用法理图来指导法律概念识别的逻辑正确性。本发明在生成法律概念规则树步骤中,将法律专家整理的规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性。本发明创造性的提出了BSFC算法,实现了法理图的广度优先条件遍历。
技术领域
本发明涉及自然语言分析处理技术领域,涉及一种法律文本法律概念识别系统实现方法。
背景技术
目前,实现类似法律概念识别这样的系统,主要是靠人工定义一套法律概念集,使用关键词定义其语义匹配模式,通过由关键词生成的正则表达式规则来匹配法律概念,这种方法由于其实现简单,准确性高等优势,为工业界普遍采用。但是,法律概念纷繁冗杂,需要考虑输入的法律文本是一个法律文书中的段落文本,还是一个口语化得法律问答文本;具体的案由和法律场景;法律概念之间的逻辑关系,如并列关系、互斥关系、推理关系等。综合考虑这些错综复杂的关系,才能实现一个较好的法律概念识别结果。
现有技术中,这种方式的缺点是,简单基于正则表达式的模式匹配,准确率高,但是没有考虑法律概念间的逻辑依存和推理关系,得到的结果往往和最基本的逻辑相违背。究其原因是因为法律概念知识庞杂,很多法律概念存在互斥和推理的关系,一味的使用关键词匹配,不考虑它们之间的逻辑,就会出现明显的违背逻辑的情况。
因此,本发明提供了一种基于法理图规则引擎的法律概念识别方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种基于法理图规则引擎的法律概念识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于法理图规则引擎的法律概念识别方法,其特征在于,其包括以下步骤:
(1)划分数据集:
按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;比如根据涉及的案由,法律文本可以分为刑事、民事、行政等。刑事案由,继续细分又可分成很多子类,如盗窃罪、抢劫罪、交通肇事罪等;民事案由又可以继续划分成离婚纠纷、合同纠纷等等。场景就是更加细分的问题域,比如民事案由下的离婚纠纷,可以根据具体情况继续划分,如请求财产分割、请求子女抚养权等
(2)数据准备和预处理:
法律专家使用法律概念编辑管理工具进行法律概念整理,主要是对法律概念识别的规则做基本限定,同时针对具体的法律场景,法律专家进行法律图的构建;
(3)生成法律概念规则树:
根据法律概念识别规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性;
(4)集成法理图和规则树,生成法理图规则引擎;
(5)在指定数据集上测试规则引擎;
(6)抽样检查,并使用准确率、召回率、F1值进行评价;
(7)如果评价结果未达标,则转到步骤(8),否则转到步骤(9);
(8)调整规则树和法理图,转到步骤(4);
(9)整理并交付数据。
进一步,作为优选,在所述步骤(2)中,法律概念编辑管理工具至少能够实现法律概念的新建、修改、删除、查询功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京擎盾信息科技有限公司,未经南京擎盾信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910714738.7/2.html,转载请声明来源钻瓜专利网。