[发明专利]一种针对司法案件的基于Neural Embedding智能分析方法在审
申请号: | 202010626120.8 | 申请日: | 2020-07-02 |
公开(公告)号: | CN111753059A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 肖利;蒋欣辰;曾芳伊雯 | 申请(专利权)人: | 成都睿码科技有限责任公司;杭州数峰科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295;G06Q50/18 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 林菲菲 |
地址: | 610000 四川省成都市中国(四川)自*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 司法 案件 基于 neural embedding 智能 分析 方法 | ||
1.一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,包括以下步骤,
S1:搜集刑事法律文书,并对案情事实描述文书进行预处理;
S2:将预处理后的案情事实描述文本作为文档实体,案件所涉及的法条、被告人的罪名和刑期长短要素作为文档实体所对应的多个标签实体,使用随机梯度下降的方式,训练文档实体和标签实体的Embedding向量;
S3:使用S2中训练得到的Embedding向量,对新的数据计算文档实体和标签实体的相似度。
2.根据权利要求1所述的一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,步骤S1中的对案情事实描述文书进行预处理包括以下子步骤,
S101:过滤案情事实描述文书中的停用词和特殊符号,保留汉字数字及标点符号信息,并对文本进行分词;
S102:将案情事实描述文本中的刑事敏感词数字做离散化处理。
3.根据权利要求2所述的一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,步骤S102中所述的刑事敏感词包括金钱、重量和血液酒精浓度三种类型。
4.根据权利要求1所述的一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,获得步骤S2中Embedding向量的具体方法包括以下步骤,
S201:首先,采用特征求和的方式获取稳当实体a的向量;
S202:然后,映射出与文档实体维度一致的标签实体b的向量;
S203:最后,对文档实体a的向量和标签实体b的向量建立损失函数,得到Embedding向量。
5.根据权利要求4所述的一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,S201的具体步骤如下,
使用N-Gram以词袋形式作为案情描述文档的特征,每个文档都由一组来自固定长度字典的离散特征进行描述,为每个特征分配一个d维向量,然后将特征求和作为文档实体的向量,假设字典D的特征定义为D×d的矩阵F,其中Fi索引第ith个特征,∑i∈aFi作为文档实体a的向量。
6.根据权利要求4所述的一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,S202的具体步骤如下,
将法条、被告人被判的罪名和刑期长短要素的所有离散值作为不同的标签实体b,并将所有标签实体映射为与文档实体维度一致的不同向量。
7.根据权利要求4所述的一种针对司法案件的基于Neural Embedding智能分析方法,其特征在于,S203的具体步骤如下,
对文档实体a和标签实体b建立损失函数,见公式(1):
这个公式由以下几部分组成:
1)从数据中生成正例实体对(a,b),a为案情事实描述的文档实体,b为文档实体a所对应的标签实体,比如文档实体a对应的法条、被告人被判的罪名和刑期长短标签;
2)从不属于文档实体a的标签中随机采样得到负例实体b-,形成负例实体对(a,b-);
3)使用余弦相似度计算不同实体对的相似度;
4)损失函数Lbatch,通过比较正例实体对和负例实体对的差异计算损失;在此采用margin ranking loss作为损失函数,见公式2:
其中,B为batch size,N为负例数目,pb表示正例实体对,pn表示负例实体对,score函数为实体对的相似度函数,损失函数通过随机梯度下降进行优化,使得具有相关性的实体向量具有更高的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都睿码科技有限责任公司;杭州数峰科技有限公司,未经成都睿码科技有限责任公司;杭州数峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010626120.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物流运输专用包装箱
- 下一篇:轮毂轴承轴向负游隙检测用的检测装置