[发明专利]事实描述文本预测方法及装置有效
申请号: | 201810903715.6 | 申请日: | 2018-08-09 |
公开(公告)号: | CN110858269B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 刘知远;涂存超;胡紫昆;李想;孙茂松 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06Q10/04;G06Q50/18 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事实 描述 文本 预测 方法 装置 | ||
1.一种事实描述文本预测方法,其特征在于,包括:
对待预测案件的事实描述文本进行预处理,获得多个词向量;
将所述多个词向量按顺序输入至事实描述文本预测网络模型中,获得所述待预测案件的事实描述文本预测结果;
所述将所述多个词向量按顺序输入至事实描述文本预测网络模型中,获得所述待预测案件的事实描述文本预测结果的步骤,进一步包括:
将所述多个词向量顺序输入至事实描述文本预测网络模型的长短期记忆循环神经网络层中,输出案件文本特征;
将所述案件文本特征输入至事实描述文本预测网络模型的注意力层,输出所述待预测案件所对应的罪名的各属性表示向量;所述注意力层利用注意力机制引入事实描述文本的罪名属性信息,用于对所述案件文本特征所隐含的罪名属性信息进行提取;
将所述案件文本特征输入至事实描述文本预测网络模型的池化层获得文本表示向量,将所述待预测案件所对应的罪名的各属性表示向量的平均值与所述文本表示向量进行拼接,获得案件表示向量;
将所述案件表示向量输入至事实描述文本预测网络模型的线性层和softmax层获得待预测案件的事实描述文本预测结果;
其中,所述事实描述文本预测网络模型是基于刑事法律文书样本集中的案情描述文本、案情所对应的实际罪名以及所述实际罪名对应的属性信息训练得到。
2.根据权利要求1所述的方法,其特征在于,所述对待预测案件的事实描述文本进行预处理,获得多个词向量的步骤具体为:
对待预测案件的事实描述文本进行分词处理;
利用word2vec工具,获取所述待预测案件的事实描述文本中的每个词语所对应的词向量。
3.根据权利要求1所述的方法,其特征在于,所述将所述案件文本特征输入至所述事实描述文本预测网络模型的注意力层,输出所述待预测案件所对应的罪名的各属性表示向量的步骤,具体为:
根据所述案件文本特征,利用注意力机制分别计算所述待预测案件所对应的罪名的各属性表示向量gk:
其中,ht表示案件文本特征中的第t个案件文本特征向量,gk表示所述待预测案件所对应的罪名的第k个属性的表示向量,uk表示通过训练获得的第k个属性对应的特征向量参数,Wα表示通过训练获得的所有罪名属性对应的矩阵参数,αk,t表示第t个案件文本特征向量在计算第k个属性表示时的权重。
4.根据权利要求1所述的方法,其特征在于,所述事实描述文本预测网络模型采用如下方法训练得到:
构建刑事法律文书训练样本集,所示刑事法律文书训练样本集中的每个样本均包括经过预处理的案情描述文本、案情所对应的实际罪名以及所述实际罪名对应的属性信息;
利用长短期记忆循环神经网络对所述刑事法律文书训练样本集中的案情描述文本进行特征提取,获得案件文本特征;
将所述案件文本特征输入至注意力层,获得所述案情描述文本所对应的罪名的各属性表示向量,并将所述各属性表示向量输入至第一线性层和第一softmax层获得罪名属性的预测值;
将所述案件文本特征输入至池化层获得文本表示向量,将所述罪名的各属性表示向量的平均值与所述文本表示向量进行拼接,获得案件表示向量,并将所述案件表示向量输入至第二线性层和第二softmax层,获得所案情描述文本的事实描述文本预测结果;
定义目标优化函数由罪名预测损失函数和属性预测损失函数两部分组成,所述罪名预测损失函数通过计算事实描述文本预测结果与实际罪名的交叉熵得到,所述属性预测损失函数通过计算罪名属性的预测值与实际罪名所对应的属性信息的交叉熵得到;
利用随机梯度下降法对所述目标优化函数进行优化训练,当达到训练结束条件时,获得训练完成的事实描述文本预测网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810903715.6/1.html,转载请声明来源钻瓜专利网。