[发明专利]一种类案推荐方法、系统及装置在审
申请号: | 201811591283.6 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109783640A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 方清 | 申请(专利权)人: | 广州恒巨信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉;何文聪 |
地址: | 510630 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 最终相似度 标签 语料库 权重 系统及装置 相似度 排序 裁判 标签模型 提取特征 语义 精准度 应用 | ||
1.一种类案推荐方法,其特征在于,包括以下步骤:
获取裁判文书,并对裁判文书进行处理得到案例语料库;
计算新案例与案例语料库中每个案例的相似度;
根据新案例提取特征标签,并计算得到标签权重总值;
根据新案例与案例语料库中每个案例的相似度和标签权重总值,计算得到最终相似度;
根据最终相似度进行排序,得到类案推荐列表。
2.根据权利要求1所述的一种类案推荐方法,其特征在于:所述的获取裁判文书,并对裁判文书进行处理得到案例语料库,这一步骤具体包括:
获取裁判文书,并从裁判文书中提取得到各案例的诉讼案情信息;
对诉讼案情信息进行分词处理,得到案例文件语料;
调用doc2vec模型对案例文件语料进行训练,得到词向量、softmax参数和文档向量,形成得到案例语料库。
3.根据权利要求1所述的一种类案推荐方法,其特征在于:所述的计算新案例与案例语料库中每个案例的相似度,这一步骤具体包括:
根据案例语料库的词向量和softmax参数,计算得出新案例的文档向量;
计算新案例的文档向量与案例语料库中每个案例的文档向量之间的计算欧式距离,得到新案例与案例语料库中每个案例的相似度。
4.根据权利要求1所述的一种类案推荐方法,其特征在于:所述的根据新案例提取特征标签,并计算得到标签权重总值,这一步骤具体包括:
根据新案例的诉讼案情信息提取特征标签,并对其标准格式化,得到新案例的标签值;
根据预设的权重定义规则和新案例的标签值,对新案例的标签权重因子进行设定;
根据新案例的标签值和标签权重因子,计算得到标签权重总值。
5.根据权利要求1所述的一种类案推荐方法,其特征在于:所述的最终相似度的计算公式为:
Wt=0.5*W1+(1-0.5)*(1/(1+lnW2));
其中,Wt表示最终相似度,W1表示相似度,W2表示标签权重总值。
6.一种类案推荐系统,其特征在于,包括:
案例语料库生成单元,用于获取裁判文书,并对裁判文书进行处理得到案例语料库;
相似度计算单元,用于计算新案例与案例语料库中每个案例的相似度;
标签单元,用于根据新案例提取特征标签,并计算得到标签权重总值;
最终相似度计算单元,用于根据新案例与案例语料库中每个案例的相似度和标签权重总值,计算得到最终相似度;
列表生成单元,用于根据最终相似度进行排序,得到类案推荐列表。
7.根据权利要求6所述的一种类案推荐系统,其特征在于:所述的案例语料库生成单元具体包括:
获取单元,用于获取裁判文书,并从裁判文书中提取得到各案例的诉讼案情信息;
分词单元,用于对诉讼案情信息进行分词处理,得到案例文件语料;
训练单元,用于调用doc2vec模型对案例文件语料进行训练,得到词向量、softmax参数和文档向量,形成得到案例语料库。
8.根据权利要求6所述的一种类案推荐系统,其特征在于:所述的相似度计算单元具体包括:
文档向量计算单元,用于根据案例语料库的词向量和softmax参数,计算得出新案例的文档向量;
欧式距离计算单元,用于计算新案例的文档向量与案例语料库中每个案例的文档向量之间的计算欧式距离,得到新案例与案例语料库中每个案例的相似度。
9.根据权利要求6所述的一种类案推荐系统,其特征在于:所述的标签单元具体包括:
标准化单元,用于根据新案例的诉讼案情信息提取特征标签,并对其标准格式化,得到新案例的标签值;
标签权重因子设定单元,用于根据预设的权重定义规则和新案例的标签值,对新案例的标签权重因子进行设定;
标签权重总值计算单元,用于根据新案例的标签值和标签权重因子,计算得到标签权重总值。
10.一种类案推荐装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-5任一项所述一种类案推荐方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州恒巨信息科技有限公司,未经广州恒巨信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811591283.6/1.html,转载请声明来源钻瓜专利网。