[发明专利]一种面向裁判文书的证据链关系模型的构建方法有效
申请号: | 201710376342.7 | 申请日: | 2017-05-22 |
公开(公告)号: | CN107632968B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 葛季栋;周业茂;孔思圆;李忠金;李传艺;周筱羽;骆斌 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F16/84;G06F16/21 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 裁判 文书 证据 关系 模型 构建 方法 | ||
本发明是一种面向中文裁判文书的证据链关系模型构建方法,构建方法的流程如图所示,主要包括以下步骤:针对中文裁判文书进行文本预处理;读取处理后的XML格式文件提取出证据链体集合和事实集合;根据4W1H关键要素提取策略获得每个证据链体及事实的关键词集合;通过计算关键要素关联度构造证据链关系模型中的联结完成模型构建;将构建出的模型生成为Excel表格;将结构化模型显示为可视模型。本发明主要针对法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书词汇的特点,改善裁判文书预处理方法,优化关键要素提取技术,提高证据链中联结的计算正确率,能够有效运用于评估裁判文书的事实说理水平。
技术领域
本发明涉及一种裁判文书说理分析技术,具体涉及一种面向裁判文书的证据链关系模型构建方法,属于自然语言处理技术领域。
背景技术
裁判文书的说理技术研究主要基于对证据链的提取与分析,研究遵循法言法语及文书说理(带有法律术语特征的语言)的自然语言处理技术,抽取裁判文书说理的关键语段和证据,逆向构建证据链和文书说理逻辑关系,并通过计算机程序绘制可视化的证据链与文书说理逻辑图。对于历史大数据的处理,需要引入Hadoop或Spark等大数据处理技术部署该抽取算法,保持较高的处理效率。
案件中由多个证据、证据间关系及证据与事实关联构成的集合称为证据链。关于证据链的研究由来已久,Bentham在《Rationale of Judicial Evidence》一书中根据各种不同司法证据的案例透彻的分析了司法举证的合理性,并提出了构建合理证据链的指导。上海市人民检察院第二分院法律政策研究室的陈为钢的《刑事证据链研究》是国内对于证据链研究的代表作,定义了证据链的链节、链头、链体和联结点等基本概念,并提出了证据链的简单联结、多重联结和网状联结等多种不同的联结形态。
对法律文书的研究主要限于相关法律专业人士,直到1970年Buchanan发表的《关于人工智能和法律推理若干问题的考察》标志着人工智能与法律作为研究分支的诞生。该文讨论了法律推理模型的可行性,借助于计算机编程提出判决建议模型、法律分析并强调了类推的重要性。近年来随着人工智能算法和自然语言处理技术再一次成为热潮,国内外涌现出很多自动分析法律文书语义及证据信息的研究。2007年Bex, F.J.在文章《Formalising argumentative story-based analysis of evidence》中提出形式化的、论证性的、基于故事的证据分析方法,该方法将证据与事实表达为因果性网络,为案件事实的判定提出启发式的解释,使用可替代的事实解释引导进一步的证据收集,为证据强弱程度的分析打下基础。2011年Keppens J在《On Extracting Arguments from BayesianNetwork Representations of Evidential Reasoning》中提出从贝叶斯网络中提取论证图的方法;因为贝叶斯网络可以精确地、全面地表现出推理假设和争议证据之间的关系,所以贝叶斯网络是分析法律文书说理逻辑的一个重要途径;协同使用贝叶斯网络和论证图可以结合两者的优点,实现可量化的、可视的证据推理关系图。
裁判文书中证据、事实信息的书写具有一定的规范,但是每个证据链关系模型有其特殊之处存在很多不确定性,比如证据链节的链头数量无法估量,所以并不能直接将现有的建模方式和无监督的机器学习运用到模型的构建中。针对这个问题,本专利运用面向裁判文书特征的自然语言处理技术进行文本预处理,然后采用先提取关键要素再计算关联度的方法来实现证据链头的计算,为证据链节之间、证据与事实之间建立关联。在计算证据链头时采用哈希算法,哈希算法的原理是抽样,就是提取信息的特征,与证据链头计算的目标是一致的。哈希算法是一种单向密码体制,是一个不可逆的映射,哈希函数可以将任意长度的输入经过变化以后得到固定长度的输出,如果输入数据中有变化,则哈希也会发生变化。哈希表是根据设定的哈希函数H(key)和处理冲突方法将一组关键字映射到一个有限的地址区间上,并以关键字在地址区间中的象作为记录在表中的存储位置,作为线性数据结构与表格和队列等相比,哈希表无疑是查找速度比较快的一种。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710376342.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于存储装置的映射表
- 下一篇:一种基于卷积神经网络的眼球移动预测方案