[发明专利]一种根据犯罪事实的描述自动生成法院观点的方法有效
申请号: | 201811210148.2 | 申请日: | 2018-10-17 |
公开(公告)号: | CN109408630B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 王世晞;张亮;徐建忠;刘涛 | 申请(专利权)人: | 杭州世平信息科技有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/289;G06Q50/18;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 310012 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 根据 犯罪 事实 描述 自动 生成 法院 观点 方法 | ||
本发明公开了一种根据犯罪事实的描述自动生成法院观点的方法,该方法是将根据犯罪事实的描述自动生成法院观点视为基于Seq2Seq模型的自然语言生成任务。Seq2Seq模型中,本发明采用双向LSTM加上Attention机制对犯罪事实的描述进行编码,LSTM进行解码生成对应的法院观点。本发明节省了法官时间,为法律文书自动化生成迈进了一步。
技术领域
本发明属于自然语言处理技术领域,具体涉及一种根据犯罪事实的描述自动生成法院观点的方法。
背景技术
随着人工智能的快速发展,人工智能在法律领域的应用也越来越热,其中自动化法律文本生成是目前的一个难点。自动化法律文本生成可以节省大量人力,将法律从业人员从起草者变成审校者。自动化法律文本生成中,法院观点的生成是一个难点。法院观点需要包含与罪名相关的重要的犯罪事实细节(如对故意伤害罪来说,伤害程度、伤害人数等)。与文本转述不同,法院观点需要将犯罪事实进行一定的归纳总结;与文本摘要技术不同,法院观点并不是将犯罪事实进行摘要,而是从犯罪事实中找出和罪名相关的细节,继而生成相应的语句。因此现有的文本转述技术和自动摘要技术都并不适用于根据犯罪事实描述生成法院观点这个场景。
发明内容
本发明的目的在于提供一种根据犯罪事实的描述自动生成法院观点的方法,以克服现有技术的缺点,本发明节省了法官时间,为法律文书自动化生成迈进了一步。
为达到上述目的,本发明采用如下技术方案:
一种根据犯罪事实的描述自动生成法院观点的方法,包括以下步骤:
步骤1)构建根据犯罪事实描述生成法院观点的模型;
步骤2)将犯罪事实输入步骤1)构建的模型中,输出法院观点。
进一步地,步骤1)具体包括以下步骤:
步骤1.1)构建训练数据集,所述训练数据集由犯罪事实描述、罪名及法院观点对应组成;
步骤1.2)对训练数据集中的犯罪事实描述和法院观点进行预处理,使用自然语言处理工具对犯罪事实描述和法院观点进行分词,将所有犯罪事实描述包含的词和所有法院观点包含的词分别形成两个词表,根据词表分别将犯罪事实描述和法院观点的词序列转化为one-hot词向量序列:Xseq和Yseq;
步骤1.3)以犯罪事实描述one-hot词向量序列Xseq和罪名V做为模型输入,法院观点one-hot词向量序列Yseq做为输出,利用机器学习技术对模型进行训练,得到模型中的各个参数。
进一步地,步骤1.1)中获取训练数据集的方法为:从裁判文书网中遍历罪名爬取刑事判决书,对每一份刑事判决书,通过正则表达式提取出犯罪事实描述和法院观点,将犯罪事实描述和法院观点与罪名组合起来形成训练数据集。
进一步地,所述犯罪事实描述为包含经审理查明的段落;所述法院观点为包含本院认为的句子。
进一步地,步骤1.3)具体为:
模型使用两个Word-embedding层分别将Xseq和Yseq的稀疏one-hot词向量转化成embedding词向量x,y,使用单层神经网络将罪名的one-hot向量转化为密集向量Ev,并使用双向LSTM和Attention机制对犯罪事实的描述进行编码,对于时刻i,隐藏状态hi为:
其中和分别为正向和反向LSTM在时刻i的隐藏状态:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州世平信息科技有限公司,未经杭州世平信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811210148.2/2.html,转载请声明来源钻瓜专利网。