[发明专利]一种类案推荐方法、系统及装置在审
申请号: | 201811591283.6 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109783640A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 方清 | 申请(专利权)人: | 广州恒巨信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉;何文聪 |
地址: | 510630 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 最终相似度 标签 语料库 权重 系统及装置 相似度 排序 裁判 标签模型 提取特征 语义 精准度 应用 | ||
本发明公开了一种类案推荐方法、系统及装置,方法包括:获取裁判文书,并对裁判文书进行处理得到案例语料库;计算新案例与案例语料库中每个案例的相似度;根据新案例提取特征标签,并计算得到标签权重总值;根据新案例与案例语料库中每个案例的相似度和标签权重总值,计算得到最终相似度;根据最终相似度进行排序,得到类案推荐列表。本发明通过提取标签算得标签权重总值,进而计算得到最终相似度,最后根据最终相似度进行排序列表,克服了原来的标签模型没有语义的缺点,大大提高了类案推荐的精准度。本发明可广泛应用于类案推荐领域中。
技术领域
本发明涉及推荐技术领域,尤其涉及一种类案推荐方法、系统及装置。
背景技术
现有的类案推荐系统在实践中主要有两种形态:第一种是自动推送,自动推送是技术人员依托网上公布的裁判文书建立数据库,在此基础上对相关案件“贴标签”,将每个具体案例结构化为数十个法律标签。再将起诉书接入系统,与系统中的标签对比,推送标签最相似的案例;第二种是主动搜索,主动搜索是指法官对系统自动推送的类案不满意时,自主选取系统中罗列出的标签,在此基础上输入关键词,通过一整套的标签和自主搜索,在数据库中检索符合条件的类案。但是这两种推荐系统普遍存在推送类案不准确、案情细节不匹配等问题。
发明内容
为了解决上述技术问题,本发明的目的提供一种能提高推荐精准度的类案推荐方法、系统及装置。
本发明所采取的技术方案是:
一种类案推荐方法,包括以下步骤:
获取裁判文书,并对裁判文书进行处理得到案例语料库;
计算新案例与案例语料库中每个案例的相似度;
根据新案例提取特征标签,并计算得到标签权重总值;
根据新案例与案例语料库中每个案例的相似度和标签权重总值,计算得到最终相似度;
根据最终相似度进行排序,得到类案推荐列表。
作为所述的一种类案推荐方法的进一步改进,所述的获取裁判文书,并对裁判文书进行处理得到案例语料库,这一步骤具体包括:
获取裁判文书,并从裁判文书中提取得到各案例的诉讼案情信息;
对诉讼案情信息进行分词处理,得到案例文件语料;
调用doc2vec模型对案例文件语料进行训练,得到词向量、softmax参数和文档向量,形成得到案例语料库。
作为所述的一种类案推荐方法的进一步改进,所述的计算新案例与案例语料库中每个案例的相似度,这一步骤具体包括:
根据案例语料库的词向量和softmax参数,计算得出新案例的文档向量;
计算新案例的文档向量与案例语料库中每个案例的文档向量之间的计算欧式距离,得到新案例与案例语料库中每个案例的相似度。
作为所述的一种类案推荐方法的进一步改进,所述的根据新案例提取特征标签,并计算得到标签权重总值,这一步骤具体包括:
根据新案例的诉讼案情信息提取特征标签,并对其标准格式化,得到新案例的标签值;
根据预设的权重定义规则和新案例的标签值,对新案例的标签权重因子进行设定;
根据新案例的标签值和标签权重因子,计算得到标签权重总值。
作为所述的一种类案推荐方法的进一步改进,所述的最终相似度的计算公式为:
Wt=0.5*W1+(1-0.5)*(1/(1+lnW2));
其中,Wt表示最终相似度,W1表示相似度,W2表示标签权重总值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州恒巨信息科技有限公司,未经广州恒巨信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811591283.6/2.html,转载请声明来源钻瓜专利网。