[发明专利]一种基于注意力机制的刑期预测方法、设备及存储设备有效
申请号: | 202010430900.5 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111768024B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 孙晨鹏;李新川;李旦;赵东阳;陈仁谣 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/18;G06F40/30;G06F40/289;G06N3/0464;G06N3/0442;G06N3/045;G06F18/24 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 彭建怡 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 刑期 预测 方法 设备 存储 | ||
1.一种基于注意力机制的刑期预测方法,其特征在于:包括以下步骤:
S1、获取某一关于犯罪实例的数据集,根据数据集中犯罪事实的罪名标签获取相应罪名的量刑标准;所述数据集中每条数据包括“罪名”、“被告人姓名”、“刑期”和“犯罪事实”;
S2、对犯罪事实和量刑标准进行预处理;所述预处理包括:分词、去停用词和用“CRIMINAL”来替换被告人姓名;处理中文文本首要任务是分词,然后根据停用词表去除停用词;
S3、对数据集中涉及的刑期进行处理,将刑期分为8类;分类时,不考虑无期和死刑,以月为单位,根据有期徒刑等级将数据分成8类,即:0~6个月,6个月~1年,1年~2年,2年~3年,3年~5年,5年~7年,7年~10年,10年以上;
S4、根据Word2vec软件将预处理后的犯罪事实和量刑标准均转为词向量矩阵;对于经过分词后的数据集,用Word2vec训练词向量,得到每个词的向量表示,然后根据数据集构建词表:每个词对应各自的向量表示;对于一个有Q个词的句子由Q个词的向量依次表示,Q为大于0的整数,由此可知,犯罪事实表示为:量刑标准表示为:其中w∈Rd,Rd是Word2vec训练的词向量的维度;M和N分别为犯罪事实和量刑标准中句子的长度,m和n分别表示犯罪事实的第m个词和量刑标准中句子的第n个词;
S5、将所述词向量矩阵输入到长短时记忆网络中,输出包含上下文语义的第一特征向量;所述输入长短时记忆网络是指将犯罪事实和量刑标准的词向量矩阵分别输入两个不同的长短时记忆网络;将犯罪事实和量刑标准的词向量矩阵分别输入LSTM后,得到每一时刻的隐藏层状态和如公式(1)和公式(2)所示:
是指将犯罪事实f输入到长短时记忆网络中,是指将量刑标准c输入到长短时记忆网络中;
S6、得到了经过长短时记忆网络后每个时刻的隐藏层状态,对于一个犯罪事实而言,并不是所有的词或句子都对量刑有帮助,相应的适用于某一罪名对应的量刑标准也只是本罪名下所有量刑标准中的一部分;通过注意力机制选取第一特征向量中各词的第二特征向量和第三特征向量,并将第二特征向量与第三特征向量进行拼接,得到特征矩阵;
得到特征矩阵具体包括:
S61、通过某一犯罪事实对量刑标准的注意力机制,计算量刑标准中不同词的权重,并将权重与量刑标准经过LSTM网络后的隐藏层向量相乘后得到第二特征向量;其权重计算方法如公式(3)所示:
其中,是指犯罪事实经过LSTM网络之后最后时刻的隐藏层向量表示,是指量刑标准经过LSTM网络之后第j个词的隐藏层向量表示;公式(3)计算的权重,用来得到犯罪事实中每个词的向量表示;
S62、通过量刑标准对犯罪事实的注意力机制,计算犯罪事实中不同词的权重,并将权重与犯罪事实经过LSTM网络后的隐藏层向量相乘后得到第三特征向量;其权重计算方法如公式(4)所示:
其中,是指量刑标准经过LSTM网络之后最后时刻的隐藏层向量表示,是指犯罪事实经过LSTM网络之后第k个词的隐藏层向量表示;公式(4)计算的权重,用来得到量刑标准中每个词的向量表示;
S63、将第二特征向量和第三特征向量进行拼接,得到特征矩阵;
S7、将所述特征矩阵输入到卷积神经网络中进行训练,得到刑期预测模型;训练得到刑期预测模型时,先对所述特征矩阵进行卷积操作,然后进行最大池化操作,最后通过全连接层训练分类器;
S8、将实际获取的某一犯罪事实输入到训练好的刑期预测模型中,得到预测的刑期类别,即预测出该某一犯罪事实对应的上述8个刑期类别中的哪一个刑期类别。
2.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1所述的基于注意力机制的刑期预测方法。
3.一种基于注意力机制的刑期预测设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1所述的基于注意力机制的刑期预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010430900.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理