[发明专利]基于深度学习的盗窃罪辅助量刑方法在审

专利信息
申请号: 201910870274.9 申请日: 2019-09-16
公开(公告)号: CN110610005A 公开(公告)日: 2019-12-24
发明(设计)人: 叶麟;张宏莉;方滨兴;李尚;郭镔;蔡怡蕾;郭小丁;陈喆 申请(专利权)人: 哈尔滨工业大学
主分类号: G06F17/27 分类号: G06F17/27;G06F16/33;G06N3/04;G06N3/08;G06Q50/18;G06Q50/26
代理公司: 23209 哈尔滨市伟晨专利代理事务所(普通合伙) 代理人: 刘坤
地址: 150001 黑龙*** 国省代码: 黑龙;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 人工标注 多层神经网络 循环神经网络 盗窃 计算机领域 特征生成器 文本预处理 形式化描述 犯罪事实 角度定义 判决结果 特征向量 线性回归 一维特征 语义表示 语义理解 预测结果 主体信息 词向量 预测器 预测 构建 语料 整合 裁判 输出 案件 犯罪 学习
【权利要求书】:

1.一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,包括以下步骤:

步骤a、根据刑法规定和关于盗窃罪的量刑规定,结合已公开的盗窃罪一审判决书,从被盗窃物品价值、犯罪主体信息、犯罪事实描述、判决结果角度定义形式化描述盗窃案的11维特征,所述11维特征包括被盗窃物品价值、被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节以及判决刑期;

步骤b、对裁判文书进行文本预处理;

步骤c、将预处理后得到的所有文本整合为语料集,训练词向量;

步骤d、完成除被盗窃物品价值和刑期之外其余9维特征的提取,使用循环神经网络为每一维特征分别构建特征生成器,以句子为单位对词向量序列进行训练从而提取特征值;

步骤e、使用线性回归和多层神经网络模块作为预测器,案件特征向量作为输入,输出以月为单位的刑期预测结果。

2.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述将预处理后得到的所有文本整合为语料集,使用Word2Vec训练词向量,参数设置为使用CBOW模型、使用负采样方法优化,分别训练向量维度为100、150、200、250和300的5组词向量。

3.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述文本预处理包括无关段落去除、数值型特征提取和无关词语去除。

4.根据权利要求3所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述无关段落包括辩护人信息、审理流程描述、公诉机关的判决建议、被告人和辩护人的辩护意见和法院经审理查明的事实,采用正则表达式匹配所述无关段落的起始段与结束段,将起始段与结束段连同中间段落一并删去。

5.根据权利要求3所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述数值型特征包括被盗窃物品价值和刑期,采用基于规则的方法提取。

6.根据权利要求5所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述被盗窃物品价值是指盗窃物品的总金额,所述被盗窃物品的金额信息包含在案件事实描述,所述金额信息具有固定格式,通过正则表达式提取所有符合所述格式的字符串,得到所有金额数值,同时判断金额字符串所在的句子是否包括“返还、赔偿、退赔、退缴、归还、退还、赔款、上交、补偿或赃款”关键词,如果包含则不将所述句子中的金额计算到总金额中,通过上述方式对每句话进行处理后,累加得到的数值便是被盗窃物品的总价值。

7.根据权利要求5所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述刑期包含在法院判决意见中,刑期表示为“有期徒刑”主刑词加上“某年”字样的时长信息,其中表示数值的并非阿拉伯数字而是中文数字,通过正则表达式提取法院判决意见中符合上述格式的字符串,将其中的中文数字转换为数值后,为将其统一表示为月,将表示“年”的数值乘以12后加上表示“月”的数值得到最终的刑期结果,所述某年为一年、二年、两年、三年、四年、五年、六年、七年、八年、九年或十年。

8.根据权利要求3所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述无关词语包括人名、机构名、地名、时间以及出现频率低于阈值的词,通过政策表达式去除。

9.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述9维特征包括被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节。

10.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法,其特征在于,所述线性回归用于回归任务,多层神经网络模块用于处理非线性问题,其因变量和自变量的数目能够设置为多个。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910870274.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top