[发明专利]基于深度学习的盗窃罪辅助量刑方法在审
申请号: | 201910870274.9 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110610005A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 叶麟;张宏莉;方滨兴;李尚;郭镔;蔡怡蕾;郭小丁;陈喆 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/33;G06N3/04;G06N3/08;G06Q50/18;G06Q50/26 |
代理公司: | 23209 哈尔滨市伟晨专利代理事务所(普通合伙) | 代理人: | 刘坤 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工标注 多层神经网络 循环神经网络 盗窃 计算机领域 特征生成器 文本预处理 形式化描述 犯罪事实 角度定义 判决结果 特征向量 线性回归 一维特征 语义表示 语义理解 预测结果 主体信息 词向量 预测器 预测 构建 语料 整合 裁判 输出 案件 犯罪 学习 | ||
基于深度学习的盗窃罪辅助量刑方法属于计算机领域;无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测;包括根据刑法规定和关于盗窃罪的量刑规定,结合已公开的盗窃罪一审判决书,从被盗窃物品价值、犯罪主体信息、犯罪事实描述、判决结果角度定义形式化描述盗窃案的11维特征;对裁判文书进行文本预处理;整合为语料集,训练词向量;完成除被盗窃物品价值和刑期之外特征的提取,使用循环神经网络为每一维特征分别构建特征生成器,从而提取特征值;使用线性回归和多层神经网络模型作为预测器,输入案件特征向量,输出刑期预测结果;能够在较少依赖人工标注的情况下实现对案情的深度语义理解和给出明确的刑期预测值。
技术领域
本发明属于计算机领域,尤其涉及一种基于深度学习的盗窃罪辅助量刑方法。
背景技术
在过去几年中,司法领域的数据量迅速增长。这些数据涉及各类法律案件的裁判文书、 法律法规和司法解释。法官、律师和检察官等法律专业人员不仅要处理大量案件,还需要 查阅大量与案件相关的文件以供参考和分析。这使得法律专业人员的负担日益增加,并可 能导致工作效率降低和司法工作出错的风险增加。为了更好地捍卫司法公正、保障公共安 全,采用基于人工智能和数据挖掘技术的辅助量刑方法亟待应用于司法实践。
辅助量刑的任务不同于指控罪名预测,其目的是通过分析针对案情文本事实描述,预 测某类刑事罪名的处罚期限(例如,以年或月计算的有期徒刑,终身监禁或死刑),而不 是针对特定案件确定适当的指控(例如,盗窃,诈骗,抢劫和故意伤害罪)。由于中国内地采用的是大陆法系,法院基于成文法和当前案件的事实描述进行审判量刑,而不是参照先例案件的判决。法官将当前案件具体情况进行分析,根据适用的法律条文做出最终决定。在已有的某些司法智能辅助系统中,通过已判决生效的类似案例训练机器学习分类模型能够完成简化的刑期预测任务,但参照法律条文进行量刑在法理上更有说服力。目前,根据法律条文和案件事实描述训练机器学习模型预测刑期并非易事。
目前已有的相关工作大多采用文本分类的思路来解决刑期预测任务。这些工作或采用 经典的机器学习分类模型,从文本或案例简介中提取浅层特征,或通过人工定义特征和手 动标注案例来获得对案例描述的更深层次语义理解。尽管机器学习和自然语言处理方法的 引入可以法律文本分析,但尚无法实现在较少人工标注情况下的案情语义表示和特定罪名 的刑期精准预测。
发明内容
本发明克服了上述现有技术的不足,提供一种基于深度学习的盗窃罪辅助量刑方法, 根据《刑法》中的相关规定对盗窃案定义了11维特征,针对盗窃罪一审判决书的文本预处理,过滤对特征抽取产生干扰的文本部分和无关词语,使用循环神经网络分别对不同维度的案件特征构建生成器,使用线性回归和多层神经网络模型进行训练,根据输入的案件特征计算以月为单位的刑期预测结果,有效的解决了无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测的技术问题。
本发明的技术方案:
一种基于深度学习的盗窃罪辅助量刑方法,包括以下步骤:
步骤a、根据刑法规定和关于盗窃罪的量刑规定,结合已公开的盗窃罪一审判决书, 从被盗窃物品价值、犯罪主体信息、犯罪事实描述、判决结果角度定义形式化描述盗窃案 的11维特征,所述11维特征包括被盗窃物品价值、被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严 重情节、被告人是否累犯、是否有退赔情节、是否有自首情节以及判决刑期;
步骤b、对裁判文书进行文本预处理;
步骤c、将预处理后得到的所有文本整合为语料集,训练词向量;
步骤d、完成除被盗窃物品价值和刑期之外其余9维特征的提取,使用循环神经网络 为每一维特征分别构建特征生成器,以句子为单位对词向量序列进行训练从而提取特征 值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910870274.9/2.html,转载请声明来源钻瓜专利网。